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推荐 序 


人 类 社会 从 古 至 今 发 展 到 现在 已 是 日 新 月 异 ， 科 技 正在 为 这 个 世界 勾勒 更 加 绚丽 的 未 来 ， 
这 其 中 离 不 开 人 类 与 计算 机 之 间 沟 通 的 技术 。 和 凭借 一 行 行 的 代码 、 一 串 串 的 字符 ， 人 类 与 计算 
机 的 交流 不 再 困难 重重 、 不 再 受到 空间 的 阻隔 , 计算 机 语言 也 随 着 时 代 的 发 展 越发 体现 出 魅力 。 

JetBrains 致力 于 为 开发 者 打造 智能 的 开发 工具 ， 让 计算 机 语言 交流 也 能 够 轻松 自如 。 历 经 
15 年 的 不 断 创新 ，JetBrains 始终 在 不 断 完 善 其 平台 ， 以 满足 最 顶尖 的 开发 需要 。 

在 全 球 ，JetBrains 平台 备 受 数 百 万 开发 者 的 青睐 ， 应 用 于 各 行 各 业 ， 见 证 着 它们 的 创新 与 
突破 。 在 JetBrains 平台 上 ， 我 们 始终 追求 为 开发 者 简化 复杂 项 目的 目标 ， 利 用 JetBrains 平台 
自动 完成 项 目 中 简单 的 部 分 ， 让 开发 者 能 够 最 大 程度 地 专注 于 代码 的 设计 和 全 局 的 构建 。 

JetBrains 提供 一 流 的 工具 来 帮助 开发 者 打造 完美 的 代码 。 为 了 展现 每 一 种 语言 的 独特 性 ， 
我 们 的 IDE (集成 开发 环境 ) 致力 于 为 开发 者 提供 如 下 产品 : Java (IntelliJ IDEA)、C/C++ (CLion)、 
Python (PyCharm)、PHP (PhpStorm)、NET 跨 平 台 (ReSharper, Rider)， 并 提供 相关 的 团队 项 目 
追踪 、 代 码 审 查 工 具 等 。 不 仅 如 此 ，JetBrains 还 创造 了 自己 的 语言 一 一 Kotlin， 让 程序 的 逻辑 
和 含义 更 加 清晰 。 

与 此 同时 ，JetBrains 还 为 开源 项 目 、 教 育 行业 和 社区 提供 了 独特 的 免费 版 本 。 这 些 版 本 不 
仅 适 用 于 专业 的 开发 者 ， 满 足 相关 的 开发 需求 ， 而 且 能 够 使 初学 者 易于 上 手 ， 由 浅 入 深 地 使 用 
计算 机 语言 进行 交互 沟通 。 

2018 年 , JetBrains 将 同 清华 大 学 出 版 社 一 起 , 策划 一 套 涉及 上 述 产品 与 技术 的 高 水 平 图 书 ， 
也 希望 通过 这 套 书 ， 更 广泛 地 让 读者 体会 到 JetBrains 平台 协助 编程 的 无 穷 魅 力 。 期 待 更 多 的 
读者 能 够 高 效 开发 ， 发 挥 出 最 大 的 创造 潜力 。 

让 未 来 在 你 的 指 尖 跳动 ! 


JetBrains 大 中 华 区 市 场 经 理 
赵磊 
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Python 语言 自 诞 生 至 今 经 历 了 将 近 30 年 时 间 ， 但 是 在 前 20 年 里 ， 国 内 使 用 Python 进行 
软件 开发 的 程序 员 并 不 多 ， 而 在 近 5 年 的 时 间 里 ， 人 们 对 Python 语言 的 关注 度 迅速 提升 。 这 
并 不 仅仅 是 因为 Python 语言 非常 优秀 ， 而 是 当下 科学 计算 、 人 工 智能 、 大 数据 和 区 块 链 等 新 
技术 的 发 展 需要 。Python 语言 具有 丰富 的 动态 特性 、 简 单 的 语法 结构 和 面向 对 象 的 编程 特点 ， 
并 拥有 成 熟 而 丰富 的 第 三 方 库 ， 因 此 适合 于 很 多 领域 的 软件 和 硬件 开发 。 

本 书 是 智 捷 课 堂 开发 的 立体 化 从 书 中 的 一 本 ,所谓 “立体 化 图 书 ” 就 是 指 包 含 书籍 、 视 频 、 
课件 和 服务 等 内 容 。 智 捷 课 堂 将 广大 读者 当 作 衣食 父母 ， 不 仅 为 读者 提供 图 书 ， 还 提供 配套 视 
频 、 教 学 课件 及 答疑 服务 。 


本 书 服务 网 址 


为 了 更 好 地 为 广大 读者 提供 服务 ， 我 们 专门 为 本 书 建立 了 一 个 服务 网 址 http://www.zhijieketang. 
com/group/8， 希 望 读 者 对 书 中 内 容 发 表 评论 和 勘误 ， 提 出 宝贵 意见 。 


源 代码 


书 中 包含 了 300 多 个 完整 的 案例 项 目 源 代码 ， 大 家 可 以 到 本 书 网 站 http://www. 
zhijieketang.com/group/8 免费 注册 并 下 载 。 


我 们 的 联系 方式 
作者 微 博 : @tony_ 关 东升。 


邮箱 : eorient@sina.com。 
智 捷 课堂 在 线 课 堂 : www.zhijieketang.com。 
智 捷 课堂 微 信 公 共 号 : zhijieketang。 
读者 服务 QQ 群 : 628808216。 
致谢 
本 书 主要 由 关东 升 扎 写 。 此 外 ， 智 捷 课堂 团队 的 赵 志 荣 、 赵 大 羽 、 关 锦 华 、 闫 婷 娇 、 王 区 
然 、 关 秀 华 、 刘 佳 笑 和 赵 浩 孙 也 参与 了 部 分 内 容 的 编写 。 感 谢 赵 浩 孙 手绘 了 书 中 全 部 草图 ， 并 
从 专业 的 角度 修改 书 中 图 片 ， 力 求 更 加 真实 完美 地 呈现 给 广大 读者 。 感 谢 清华 大 学 出 版 社 的 盛 
东 亮 编辑 给 我 们 提出 了 宝贵 的 意见 。 感 谢 我 的 家 人 容忍 我 的 忙碌 ， 以 及 对 我 的 关心 和 照顾 ， 使 
我 能 抽出 这 么 多 时 间 ， 投 入 全 部 精力 专心 编写 此 书 。 由 于 时 间 仓 促 ， 书 中 难免 存在 不 妥 之 处 ， 
敬 请 读者 谅解 并 提出 宝贵 意见 。 
关东 升 
2018 年 6 月 


本 书 配套 资源 


1. 源 代码 及 教学 课件 

所 有 购买 本 书 的 读者 均 可 获得 完整 的 配套 源 代码 及 教学 课件 ， 获 取 资 源 地 址 为 http://www. 
zhijieketang.com/group/8。 

2.， 学 习 视 频 教程 

所 有 购买 本 书 的 读者 均 可 获 赠 40 多 小 时 ( 约 2500 分 钟 ) 的 “Python 从 小 白 到 大 牛 实践 ” 
视频 课程 ， 包 括 : 

(1) Python 从 小 白 到 大 牛 第 一 篇 Python 基础 : 352 分 钟 。 

(2) Python 从 小 白 到 大 牛 第 二 篇 Python 进 阶 ，621 分 钟 。 

(3) Python 从 小 白 到 大 牛 第 三 篇 Python 高 级 实用 库 与 框架 : 664 分 钟 。 

(4) Python 从 小 白 到 大 牛 第 四 篇 项 目 实战 1 一 一 网 络 爬 虫 与 怜 取 股 票数 据 : 193 分 钟 。 

(5) Python 从 小 白 到 大 牛 第 四 篇 项 目 实战 2 一 一 数据 可 视 化 与 股票 数据 分 析 : 79 分 钟 。 

(6) Python 从 小 白 到 大 牛 第 四 篇 项 目 实战 3 一 一 PetStore 宠物 商店 项 目 : 309 分 钟 。 

(7) Python 从 小 白 到 大 牛 第 四 篇 项 目 实战 4 一 一 开发 Python 版 QQ2006 聊天 工具 : 272 
分 钟 。 


说 明 : 上 述 课程 为 智 捷 课 堂 正在 热 销 课程 ， 定 价 598.00 元 人 民 币 ,读者 购买 本 书后 ， 凭 
书 中 夹带 的 学 习 卡 的 代金 卡号 到 zhijieketang.com 网 站 购买 该 课程 ， 自 购买 之 日 起 三 个 月 内 有 
效 。 视 频 课程 学 习 地 址 为 http://www.zhijieketang.com/classroom/10/courses。 


代金 卡号 使 用 具体 说 明 : 首先 在 智 捷 课堂 视频 平台 (www.zhijieketang.com) 注册 并 登录 ， 
然后 找到 相应 课程 ， 接 着 选择 页 面 中 的 【购买 课程 】 一 【去 支付 】 一 【输入 优惠 码 】 一 【使 用 】 
即 可 。 
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本 篇 包括 8 章 内容 ， 系 统 介 绍 了 Python 语言 的 基础 知识 。 内 容 包 括 Python 语言 
历史 ，Python 语言 的 特点 ， 开 发 环境 的 搭建 ， 创 建 第 一 个 Python 程序 ，Python 语法 
基础 ，Python 编码 规范 ， 数 据 类 型 ， 运 算 符 和 控制 语句 等 。 通 过 对 本 篇 的 学 习 ， 读 者 
可 以 全 面 了 解 Python 的 发 展 及 特点 ， 详 细 了 解 Python 的 语法 规范 ， 初 步 掌握 Python 
程序 设计 的 基本 方法 
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第 2 章 搭建 开发 环境 

第 3 章 第 一 个 Python 程序 
第 4 章 Python 语法 基础 
第 5 章 Python 编码 规范 
第 6 章 数据 类 型 

第 7 章 运算 符 

第 8 章 控制 语句 
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开篇 综 


:到 现在 已 经 有 20 多 年 了 ， 现 在 Python 仍然 是 非常 热门 的 编程 语言 之 一 ， 很 多 
平台 中 都 在 使 用 Python 开发 。 表 1-1 所 示 的 是 TIOBE 社区 发 布 的 2017 年 3 月 和 2018 年 3 月 
的 编程 语言 排行 榜 ， 从 排行 中 可 见 Python 语言 的 热度 ， 或 许 这 也 是 很 多 人 选择 学 习 Python 的 
主要 原因 。 


表 1-1 TIOBE 编程 语言 排行 榜 


2018 年 3 月 2017 年 3 月 变化 编程 语言 评级 变化 /% 


! 1 Java -6.320 


b 
i 


2 -6.220 
3 3 C++ -1.950 


6 10 众 Visual Basic .NET 3.391 1.070 


7 7 JavaScript 0.730 
8 12 众 Assembly language 0.980 
9 6 v PHP -0.300 
10 9 v 0.280 
11 8 v Ruby 2.42 0.090 
12 13 入 Visual Basic 党 0.520 
13 15 入 Swift 了 0.680 
14 16 入 R ; 0.860 
15 14 ~ Objective-C 0.500 
16 42 众 Go 1.830 
17 18 入 0.780 
18 11 y Delphi/Object Pascal 2. 0.030 
19 19 PL/SQL 0.470 
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1.1 Python 语言 历史 


Python 之 父 荷 兰 人 吉 多 。 范 罗 苏 姆 (Guido van Rossum) 在 1989 年 圣诞 节 期 间 ， 在 阿 姆 
斯 特 丹 ， 为 了 打发 圣诞 节 的 无 聊 时 间 ， 决 心 开发 一 门 解释 程序 语言 。1991 年 第 一 个 Python 解 


释 器 公开 版 发 布 ， 它 是 用 C 语言 编写 实现 的 ， 并 能 够 调用 C 语言 的 库 文件 。Python 一 诞生 就 回 


扫 码 看 视频 


已 经 具有 了 类 、 函 数 和 异常 处 理 等 内 容 ， 包 含 字典 、 列 表 等 核心 数据 结构 ， 以 及 模块 为 基础 的 
拓展 系统 。 

2000 年 Python 2.0 发 布 ，Python 2.0 的 最 后 一 个 版 本 是 2.7， 它 还 会 存在 较 长 的 一 段 时 间 ， 
Python 2.7 支持 时 间 延 长 到 2020 年 。2008 年 Python 3.0 发 布 ， 到 本 书 编写 时 Python 3.6 发 布 ， 
注意 本 书 是 基于 Python 3.6 版 本 编写 的 。Python 3 与 Python 2 是 不 兼容 的 ， 由 于 很 多 Python 
程序 和 库 都 是 基于 Python 2 的 ， 所 以 Python 2 和 Python 3 程序 会 长 期 并 存 ， 不 过 Python 3 的 
新 功能 吸引 了 很 多 开发 人 员 ， 很 多 开发 人 员 正 从 Python 2 升级 到 Python 3。 作 为 初学 者 ， 如 果 
学 习 Python 应 该 从 Python 3 开始 。 

Python 单词 翻译 为 “蟒蛇 ”， 想 到 这 种 动物 不 会 有 很 愉快 的 感觉 。 那 为 什么 这 种 新 语言 
取 名 为 Python 呢 ? 那 是 因为 吉 多 喜欢 看 英国 电视 秀 节 目 蒙 提 。 派 森 的 飞行 马戏 团 (Monty 
Python's Flying Circus)， 于 是 他 将 这 种 新 语言 起 名 为 Python 。 


1.2 Python 语言 设计 哲学 一 一 Python 之 禅 


Python 语言 有 它 的 设计 理念 和 哲学 ， 称 为 “ Python 之 禅 ”。Python 之 禅 是 Python 的 灵魂 ， 
理解 Python 之 祥 能 帮助 开发 人 员 编写 出 优秀 的 Python 程序 。 在 Python 交互 式 方式 运行 工具 吕 
IDLE (也 称 为 Python ShelD 中 输入 import this 命令 ， 如 图 1-1 所 示 ， 显 示 内 容 就 是 Python 之 禅 。 


ol Dotwg Optom Wedo rep 
Python 3.6.3 (v3.6.3:2c5fed8, Oct 3 2017, 16:11.49) [MSC v.1900 64 BIT 
AMD64)] on win32 

Type Teopyrght， "credits" or "license() for more information. 


+ this 
The Zer of python, by Tim Peters 


Beautiful is better than ugly. 
Explicit is better than implicit 
imple is better than complex. 
Complex is better than complicated 
Flat is better than nested. 
Sparse is better than dense. 
Readability counts. 
Special cases aren't special enough to break the rules. 
Although practicality beats purity. 
Errors should never pass siently. 
Unless explicitly silenced 
In the face of ambiguity, refuse the temptation to guess. 
There should be one-- and preferably only one --obvious way to do it 
Although that way may not be obvious at first unless you're Dutch 


Although never is often better than «right* now. 
If the implementation is hard to explain it's a bad idea 

if the implementation is easy to explain, it may be 3 good idea 
Namespaces are one honking great idea -- let's do more of those! 


sa 


图 1-1 IDLE 中 Python 之 禅 


Python 之 禅 翻 译 解 释 如 下 : 
Python 之 禅 by Tim Peters 
优美 胜 于 丑陋 
明了 胜 于 用 汲 
简洁 胜 于 复杂 


4 对 | Python 从 小 白 到 大 牛 


[ol 3 
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复杂 胜 于 凌乱 

扁平 胜 于 嵌 套 

宽松 胜 于 紧凑 

可 读 性 很 重要 

即便 是 特例 ， 也 不 可 违背 这 些 规则 

不 要 捕获 所 有 错误 ， 除 非 你 确定 需要 这 样 做 
如 果 存 在 多 种 可 能 ， 不 要 猜测 

通常 只 有 唯一 一 种 是 最 佳 的 解决 方案 
虽然 这 并 不 容易 ， 因 为 你 不 是 Python 之 父 

做 比 不 做 要 好 ， 但 不 假 思索 就 动手 还 不 如 不 做 
如 果 你 的 方案 很 难 懂 ， 那 肯定 不 是 一 个 好 方案 ， 反 之 亦 然 
命名 空间 非常 有 用 ， 应 当 多 加 利用 


1.3 Python 语言 特点 
Python 语言 能 够 流行 起 来 ， 并 长 久 不 衰 ， 得 益 于 Python 语言 有 很 多 优秀 的 关键 特点 。 这 


些 特点 如 下 。 


1) 简单 易学 

Python 设计 目标 之 一 就 是 能 够 方便 学 习 ， 使 用 简单 。 它 使 你 能 够 专注 于 解决 问题 而 不 是 过 
多 关注 语言 本 身 。 

2) 面向 对 象 

Python 支持 面向 对 象 的 编程 。 与 其 他 主要 的 语言 如 C++ 和 Java 相 比 ，Python 以 一 种 非常 
强大 又 简单 的 方式 实现 面向 对 象 编 程 。 

3) 解释 性 

Python 是 解释 执行 的 ， 即 Python 程序 不 需要 编译 成 二 进 制 代 码 ， 可 以 直接 从 源 代码 运行 
程序 。 在 计算 机 内 部 ，Python 解释 器 把 源 代 码 转换 成 为 中 间 字 节 码 形式 ， 然 后 再 把 它 解释 为 计 
算 机 使 用 的 机 器 语言 并 执行 。 

4) 免费 开源 

Python 是 免费 开放 源码 的 软件 。 简 单 地 说 ， 你 可 以 自由 地 转发 这 个 软件 、 阅 读 它 的 源 代 
码 、 对 它 做 改动 、 把 它 的 一 部 分 用 于 新 的 自由 软件 中 。 

5) 可 移植 性 

Python 解释 器 已 经 被 移植 在 许多 平台 上 ，Python 程序 无 须 修改 就 可 以 在 多 个 平台 上 运行 。 

6) 胶水 语言 

Python 被 称 为 胶水 语言 ， 所 谓 胶水 语言 是 用 来 连接 其 他 语言 编写 的 软件 组 件 或 模块 。 
Python 能 够 称 为 胶水 语言 是 因为 标准 版 本 Python 是 用 C 编译 的 ， 称 为 CPython。 所 以 Python 
可 以 调用 C 语言 ， 借 助 于 C 接口 Python 几乎 可 以 驱动 所 有 已 知 的 软件 。 

7) 丰富 的 库 

Python 标准 库 〈 官 方 提供 的 ) 种 类 繁多 ， 它 可 以 帮助 处 理 各 种 工作 ， 这 些 库 不 需要 安装 直 
接 可 以 使 用 。 除 了 标准 库 以 外 ， 还 有 许多 其 他 高 质量 的 库 可 以 使 用 。 
8) 规范 的 代码 
Python 采用 强制 缩 进 的 方式 使 得 代码 具有 极 佳 的 可 读 性 。 
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9) 支持 函数 式 编程 

虽然 Python 并 不 是 一 种 单纯 的 函数 式 编程 ， 但 是 也 提供 了 函数 式 编程 的 支持 ， 如 函数 类 
型 、Lambda 表达 式 、 高 阶 函数 和 匿名 函数 等 。 

10) 动态 类 型 

Python 是 动态 类 型 语言 ， 它 不 会 检查 数据 类 型 ， 在 变量 声明 时 不 需要 指定 数据 类 型 。 


1.4 Python 语言 应 用 前 景 


Python 与 Java 语言 一 样 ， 都 是 高 级 语言 ， 他 们 不 能 直接 访问 硬件 ， 也 不 能 编译 为 本 地 代 
码 运行 。 除 此 之 外 ，Python 几乎 可 以 做 任何 事情 。 下 面 是 Python 语言 主要 的 应 用 前 景 。 

1) 桌面 应 用 开发 

Python 语言 可 以 开发 传统 的 桌面 应 用 程序 。Tkinter、PyQt、PySide、wxPython 和 PyGTK 
等 Python 库 可 以 快速 开发 桌面 应 用 程序 。 

2) Web 应 用 开发 

Python 也 经 常 被 用 于 Web 开发 。 很 多 网 站 是 基于 Python Web 开发 的 ， 如 豆 办 、 知 平和 
Dropbox 等 。 很 多 成 熟 的 Python Web 框架 ， 如 Django、Flask、Tornado、Bottle 和 web2py 等 
Web 框架 ， 可 以 帮助 开发 人 员 快 速 开发 Web 应 用 。 

3) 自动 化 运 维 

Python 可 以 编写 服务 器 运 维 自动 化 脚本 。 很 多 服务 器 采用 Linux 和 UNIX 系统 ， 以 前 很 多 
运 维 人 员 编 写 系统 管理 Shell 脚本 实现 运 维 工 作 ， 而 现在 使 用 Python 编写 的 系统 管理 脚本 ， 在 
可 读 性 、 代 码 可 重用 性 、 可 扩展 性 等 方面 优 于 普通 Shell 脚本 。 

4) 科学 计算 

Python 语言 也 广泛 地 应 用 于 科学 计算 。NumPy、SciPy 和 Pandas 是 优秀 的 数值 计算 和 科 
学 计算 库 。 

5) 数据 可 视 化 

Python 语言 也 可 将 复杂 的 数据 通过 图 表 展 示 出 来 ， 便 于 数据 分 析 。Matplotlib 库 是 优秀 的 
可 视 化 库 。 

6) 网 络 息 虫 

Python 语言 很 早 就 用 来 编写 网 络 疏 虫 。 谷 歌 等 搜索 引擎 公司 大 量 地 使 用 Python 语言 编 
写 网 络 疏 虫 。 从 技术 层面 上 讲 ，Python 语言 有 很 多 这 方面 的 工具 ， 如 urllib、Selenium 和 
BeautifulSoup 等 ， 还 有 网 络 息 虫 框架 scrapy。 

7) 人 工 智能 

人 工 智能 是 现在 非常 火 的 一 个 研究 方向 。Python 广泛 应 用 于 深度 学 习 、 机 器 学 习 和 自然 
语言 处 理 等 方向 。 由 于 Python 语言 的 动态 特点 ， 很 多 人 工 智能 框架 都 是 采用 Python 语言 实 
现 的 。 

8) 大 数据 

大 数据 分 析 中 涉及 的 分 布 式 计算 、 数 据 可 视 化 、 数 据 库 操作 等 ，Python 中 都 有 成 熟 库 可 以 
完成 这 些 工作 。Hadoop 和 Spark 都 可 以 直接 使 用 Python 编写 计算 逻辑 。 

9) 游戏 开发 

Python 可 以 直接 调用 Open GL 实现 3D 绘制 ， 这 是 高 性 能 游戏 引擎 的 技术 基础 。 所 以 有 
很 多 Python 语言 实现 的 游戏 引擎 ， 如 Pygame、Pyglet 和 Cocos2d 等 。 


扫 码 看 视频 
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1.5 “如何 获得 帮助 


对 于 一 个 初学 者 必须 要 熟悉 如 下 几 个 Python 相关 网 址 : 

。 了 Python 标准 库 : https://docs.python.org/3/library/index.html 
*。 了 Python HOWTO: https://docs.python.org/3/howto/index.html 
。 了 Python 教程 : https://docs.python.org/3/tutorial/index.html 
。PEP 规范 ?: https://www.python.org/dev/peps/ 


@ PEP 是 Python Enhancement Proposals 的 缩写 。PEP 是 一 种 提案 ， 用 于 为 Python 社区 提供 各 种 增强 功能 的 技 
术 规 格 说 明 书 ， 提 交 新 特性 ， 以 便 让 社区 指出 问题 、 改 进 技术 文档 。 
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《论语 。， 魏 灵 公 》 日 :“ 了 了 


搭建 开发 环境 


开始 学 习 Python 技术 之 前 ， 先 了 解 如 何 搭建 Python 开发 环境 是 非常 重要 的 
就 开发 工具 而 言 ，Python 官方 只 提供 了 一 个 解释 器 和 交互 式 运行 编程 环境 ， 而 没有 IDE 
(Integrated Development Environments， 集 成 开发 环境 ) 工具 ， 事 实 上 开发 Python 的 第 三 方 


IDE 工具 也 非常 多 ， 这 里 列举 几 个 Python 社区 推荐 使 


。PyCharm，JetBrains 公司 开发 的 Python IDE 工具 。 

。 Eclipse+PyDev 插件 ，PyDev 插件 下 载 地 址 为 www.pydev.org。 

。Visual Studio Code， 微 软 公司 开发 的 ， 能 够 开发 多 种 语言 的 跨 平台 IDE 工具 。 

这 几 款 工具 都 有 免费 版 本 ， 可 以 跨 平台 (Windows、Linux 和 macOS) 。 从 编程 程序 代码 、 
调试 、 版 本 管理 等 角度 看 ，PyCharm 和 Eclipse+PyDev 都 很 强大 ， 但 Eclipse+tPyDev 安装 有 些 麻 
烦 ， 需 要 自己 安装 PyDev 插件 。Visual Studio Code 风格 类 似 于 Sublime Text 文本 的 IDE 工具 ， 


同时 又 兼顾 微软 的 IDE 易 用 性 ， 
与 PyCharm 相 比 ， 内 核 小 ， 占 用 内 存 少 ， 


目的 工具 。 


[ 欲 善 其 事 ， 必 先 利 其 器 ”做 好 一 件 事 ， 准 备 工作 非常 重要 。 在 
一 件 事 。 


只 要 是 安装 相应 的 插件 它 几 乎 都 可 以 开发 。Visual Studio Code 
开发 Python 需要 安装 扩展 (插件 )， 更 适合 有 一 定 开发 


经 验 的 人 使 用 。 而 PyCharm 只 要 下 载 完 成 ， 安 装 成 功 就 可 以 使 用 了 ， 需 要 的 配置 工作 非常 少 。 


提示 : Eclipse 工具 虽然 是 跨 平台 开发 工具 ,但 是 它 编写 源 代码 文件 的 字符 集 默认 是 平台 
相关 的 ， 即 在 Windows 平台 下 默认 字符 集 是 GBK，Linux 和 macOS 平台 下 默认 是 UTF-8。 这 样 
在 Windows 下 编写 的 源 代码 文件 如 果 有 中 文字 符 ， 当 在 其 他 平台 打开 时 ， 则 会 产生 中 文 乱码 。 


综 上 所 述 ， 笔 者 个 人 推荐 使 用 PyCharm， 但 考虑 到 广大 读者 不 同 喜好 ， 本 章 会 分 别 介绍 这 
三 个 工具 的 安装 和 配置 过 程 。 


提示 : 本 书 提供 给 读者 的 示例 源 代码 主要 都 基于 PyCharm 工具 编写 的 项 目 ， 因 此 打开 这 
些 代码 需要 PyCharm 工具 。 


2.1 搭建 Python 环境 


无 论 是 否 使 


IDE J 


[ 具 ， 首 先 应 该 安装 Python 环境 。 


环境 产品 有 多 个 ， 介 绍 如 


1) CPython 


下 。 


于 历史 的 原因 


， 能 够 提供 Python 


CPython 是 Python 官方 提供 的 。 一 般 情况 下 提 到 的 Python 就 是 指 CPython，CPython 是 
基于 C 语言 编写 的 ， 它 实现 的 Python 解释 器 能 够 将 源 代码 编译 为 字 节 码 (Bytecode)， 类 似 于 
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Java 语言 ， 然 后 再 由 虚拟 机 执行 ， 这 样 当 再 次 执行 相同 源 代 码 文件 时 ， 如 果 源 代码 文件 没有 被 
修改 过 ， 那 么 它 会 直接 解释 执行 字 节 码 文件 ， 这 样 会 提高 程序 的 运行 速度 。 

2) PyPy 

PyPy 是 基于 Python 实现 的 Python 环境 ， 速 度 要 比 CPython 快 ， 但 兼容 性 不 如 CPython。 
其 官网 为 www.pypy.org。 

3) Jython 

Jython 是 基于 Java 实现 的 Python 环境 ， 可 以 将 Python 代码 编译 为 Java 字 节 码 ， 可 以 在 
Java 虚拟 机 下 运行 。 其 官网 为 www.jython.org。 

4) IronPython 

IronPython 是 基于 .NET 平台 实现 的 Python 环境 ， 可 以 使 用 .NET Framework 链接 库 。 其 
官网 为 www.ironpython.net。 

考虑 到 兼容 性 和 其 他 一 些 性 能 ， 本 书 使 用 Python 官方 提供 的 CPython 作为 Python 开发 环 
境 。Python 官方 提供 的 CPython 有 多 个 不 同 平台 版 本 (Windows、Linux/UNIX 和 macOS)， 大 
部 分 Linux、UNIX 和 macOS 操作 系统 都 已 经 安装 了 Python， 只 是 版 本 有 所 不 同 。 


提示 : 考虑 到 大 部 分 读者 使 用 的 还 是 Windows 系统 ， 因 此 本 书 重点 介绍 Windows 平台 下 
Python 开发 环境 的 搭建 


截止 到 本 书 编写 完成 ，Python 官方 对 外 发 布 的 最 新 版 是 Python 3.6。 图 2-1 所 示 是 Python 
3.6 下 载 界面 ， 它 的 下 载 地 址 是 https://www.python.org/downloads。 其 中 有 Python 2 和 Python 
3 的 多 种 版 本 可 以 下 载 ， 另 外 还 可 以 选择 不 同 的 操作 系统 (Linux、UNIX 和 Mac OS X 和 
Windows) 。 如 果 在 当前 页 面 单 击 Download Python 3.6.x 按钮 ， 则 会 下 载 Python 3.6.x 的 安装 
文件 。 注 意 这 里 下 载 的 Windows 安装 文件 都 是 32 位 的 ， 如 果 想 下 载 64 位 安装 的 文件 ， 可 以 
单 击 图 2-1 中 国 所 示 的 Windows 超 链接 ， 进 入 如 图 2-2 所 示 页 面 ， 在 该 页 面 中 单 击 Windows 
x86-64 executable installer 超 链接 ， 下 载 Python Windows 64 位 安装 的 文件 。 


pooppp 


图 2-1 Python 下 载 界面 


@ Mac OS XX 是 苹果 桌面 操作 系统 ， 基 于 UNIX， 现 在 改名 为 macOS。 
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@ 下 载 windows ea 位 版 本 


图 2-2 下 载 Windows 64 位 版 本 界面 


作者 下 载 的 是 Windows 64 位 python-3.6.4-amd64.exe。 下 载 完成 后 就 可 以 安装 了 ， 双 击 该 
文件 开始 安装 ， 安 装 过 程 中 会 弹出 如 图 2-3 所 示 的 内 容 选 择 对 话 框 ， 选 中 复 选 框 Add Python 
3.6 to PATH 可 以 将 Python 的 安装 路 径 添加 到 环境 变量 PATH 中 ， 这 样 就 可 以 在 任何 文件 夹 下 
使 用 Python 命令 了 。 选 择 Customize installation 可 以 自 定义 安装 ， 本 例 选择 Install Now， 这 
会 进行 默认 安装 ， 单 击 Install Now 开始 安装 ， 直 到 安装 结束 关闭 对 话 框 ， 即 可 安装 成 功 。 

安装 成 功 后 ， 安 装 文件 位 于 < 用 户 文 件 夹 AppData\Local\Programs\Python\Python36 下 
面 ， 在 Windows 开始 菜单 中 打开 Python 3.6 文件 夹 ， 会 发 现 4 个 快捷 方式 文件 ， 如 图 2-4 所 
示 。 对 这 4 个 文件 进行 如 下 说 明 。 

。IDLE (Python 3.6 64-bit).Ink : 打开 Python IDLE 工具 ，IDLE 是 Python 官方 提供 的 编写 

Python 程序 的 交互 式 运行 编程 环境 工具 。 

。 了 Python 3.6 (64-bib.Ink: 打开 Python 解释 器 。 

。 Python 3.6 Manuals (64-bib.Ink: 打开 Python 帮助 文档 。 

，。， Python 3.6 Module Docs (64-bib).Ink: 打开 Python 内置 模块 帮助 文档 。 


Install Python 3.6.4 (64-bit) 


Se ~ Programs » Python3s vO [BR Pp 
> 同 
由 ;> 基 s。 
- Pe 
IDLE (Python Python3.6 Python3.6 Python 3.6 
3.564-bit) (54big Manuals Module Docs 
(64-bid 人 
python 
fo stat oncer er a eers peeormereadl 
WiNdOWS Brarymen3swmm [| a E 国 
图 2-3 安装 内 容 选择 对 话 框 图 2-4 4 个 快捷 方式 文件 


2.2 PyCharm 开发 工具 


PyCharm 是 JetBrains 公司 (www.jetbrains.com) 研发 的 开发 Python 的 IDE 开 发 工具 。 
JetBrains 公司 是 一 家 捷克 公司 ， 它 开发 的 很 多 工具 都 好 评 如 潮 ， 如 图 2-5 所 示 为 JetBrains 所 码 看 视频 
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公司 开发 的 工具 ， 这 些 工具 可 以 编写 C/C++、C#、DSL、Go、Groovy、Java、JavaScript、 
Kotlin、Objective-C、PHP、Python、Ruby、Scala、SQL 和 Swift 语言 。 


回 MN Doveloper Toos an > 


€ 了 C | ge https//wwjetorainscomproduct 


Filters 
和 锚 记 
Dee* 


Toolbox App Intellij IDEA PyCharm 


加 名 名 


Webstorm Phpstorm ReSharper 


图 2-5 JetBrains 公司 工具 


2.2.1 下 载 和 安装 

可 以 在 如 图 2-5 所 示 的 页 面 中 单 击 PyCharm 或 通过 地 址 https://www.jetbrains.com/pycharm/ 
download/， 进 入 如 图 2-6 所 示 下 载 页 面 进行 下 载 和 安装 PyCharm 工具 。 可 见 PyCharm 有 两 个 版 
本 : Professional 和 Community。Professional 是 收费 的 ， 可 以 免费 试用 30 天， 如果 超过 30 天 ， 
则 需要 购买 软件 许可 (License key)。Community 为 社区 版 ， 它 是 完全 免费 的 ， 对 于 学 习 Python 
语言 社区 版 的 读者 已 经 足够 了 。 在 图 2-6 页 面 下 载 PyCharm 工具 ， 完 成 之 后 即 可 安装 。 


Download PyCharm 


> 
Professional Community 
Full-featured IDE Lightweight IDE 
for Python & Web for Python & Scientific 
development gevelopment 


Get the ToolBox App to download PyCharm 
and its future updates with ease 


图 2-6 PyCharm 下 载 界面 
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下 载 安装 文件 成 功 后 即 可 安装 ， 安 装 过 程 非常 简单 ， 这 里 不 再 歼 述 。 
2.2.2 设置 Python 解释 器 


首次 启动 刚刚 安装 成 功 的 PyCharm， 需 要 根据 个 人 喜好 进行 一 些 基本 的 设置 ， 这 些 设置 过 
程 非常 简单 ， 这 里 不 再 资 述 。 基 本 设置 完成 后 进入 PyCharm 欢迎 界面 ， 如 图 2-7 所 示 。 单 击 
欢迎 界面 底部 的 Configure 按钮 ， 在 弹出 菜单 中 选择 Settings， 选 择 左边 Project Interpreter ( 解 
释 器 ) 打开 解释 器 配置 对 话 框 ， 图 2-8 所 示 。 如 果 右 边 的 Project Interpreter 没有 设置 ， 可 以 单 
击 下 拉 按 钮 选择 Python 解释 器 ( 见 编号 @) 。 若 下 拉 列 表 中 没有 Python 解释 器 ， 可 以 单 击 配置 
按钮 添加 Python 解释 器 〈 见 编号 @) 。 


PyCharm 
resi row Profect 
open 
heed on bem Veniea Carol 
momo cure | |@ ee 
图 2-7 PyCharm 欢迎 界面 图 2-8 配置 Python 解释 器 


在 图 2-8 中 单 击 配置 按钮 会 弹出 一 个 如 图 2-9 所 示 的 菜单 ， 单 击 
Show All 菜单 则 显示 所 有 可 用 的 Python 解释 器 ， 如 果 没有 ， 可 以 单 击 
Add Local 菜单 添加 Python 解释 器 ， 弹 出 如 图 2-10 所 示 对 话 框 ， 其 中 有 


图 2-9 配置 Python 


三 个 Python 解释 器 虚拟 环境 。 解释 器 菜单 
eaten ieee >x| 
Interpreter [<Nointerpreter> Si 
DO Conda Environment 口 Make available to all projects 


System Interpreter 


Imerpreter field is empty 


Geneal 


图 2-10 ”添加 Python 解释 器 
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。Virtuallenv Environment 是 Python 解释 器 虚拟 环境 ， 当 有 多 个 不 同 的 Python 版 本 需要 
切换 时 ， 可 以 使 用 该 选项 。 

。Conda Environment 是 配置 Conda 环境 ，Conda 是 一 个 开源 的 软件 包 管 理 系统 和 环境 管 

理 系统 。 安 装 Conda 一 般 是 通过 安装 Anaconda 实现 的 ，Anaconda 是 一 个 Python 语言 
的 免费 增值 发 行 版 ， 用 于 进行 大 规模 数据 处 理 、 预 测 分 析 和 科学 计算 ， 致 力 于 简化 包 的 
管理 和 部 署 。 

。 System Interpreter 是 配置 当前 系统 安装 的 Python 解释 器 ， 本 例 中 需要 选中 该 选项 ， 然 后 在 
右边 的 Interpreter 选择 当前 系统 安装 的 Python 解释 器 文件 夹 ， 如 图 2-11 所 示 。 

| :oemrmmmrrer ， >x| 


arpreter [DCserihiony APPOa A ocaNProgr em 


图 2-11 添加 系统 解释 器 


选择 Python 解释 器 完成 后 回 到 如 图 2-8 所 示 的 对 话 框 ， 此 时 可 见 添加 完成 的 解释 器 ， 如 
图 2-12 所 示 。 


a project mearpreter ee Maret 
> Appsmnee Spbevior 和 


9 aa9 


日 [rn 
图 2-12 添加 完成 的 解释 器 


在 图 2-12 所 示 对 话 框 中 单 击 OK 按钮 关闭 对 话 框 ， 回 到 欢迎 界面 。 


2.3 Eclipse+PyDev 开发 工具 


加 Eclipse 是 著名 的 跨 平台 IDE 工具 ， 最 初 Eclipse 是 IBM 支持 开发 的 免费 Java 开发 工具 ， 
申 2001 年 11 月 贡献 给 开源 社区 ， 现 在 它 由 非 营 利 软件 供应 商 联 盟 Eclipse 基金 会 管理 。Eclipse 
要 码 看 视频 本 身 也 是 一 个 框架 平台 ， 它 有 着 丰富 的 插件 ， 例 如 C++、Python、PHP 等 开发 其 他 语言 的 插件 。 
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另外 ，Eclipse 是 绿色 软件 ， 不 需要 写 注 册 表 ， 印 载 非常 方便 。 

安装 Eclipse 插件 要 比 PyCharm 麻烦 ， 可 分 为 三 个 步骤 : 

(1) 安装 JRE (Java 运行 环境 ) 或 JDK (Java 开发 工具 包 ), Eclipse 是 基于 Java 的 开发 工具 ， 
必须 有 Java 运行 环境 才能 运行 。 至 于 如 何 安装 IRE 或 JDK 超出 本 书 的 介绍 范围 ， 本 书 不 再 装 
述 ， 读 者 可 以 参考 其 他 资料 或 参考 笔者 另 一 著作 《Java 从 小 白 到 大 牛 》 第 2 章 内 容 。 

(2) 下 载 和 安装 Eclipse。 

(3) 安装 PyDev 插件 。 


2.3.1 Eclipse 下 载 和 安装 


本 书 采 用 Eclipse 4.68 版 本 作为 IDE 工具 ，Eclipse 4.6 下 载 地址 是 http://www.eclipse.org/ 
downloads/。 如 图 2-13 所 示 是 Windows 系统 的 Eclipse 下 载 页 面 ， 单 击 DOWNLOAD 64 bit 按 
钮 页 面 会 跳 转 到 如 图 2-14 所 示 的 选择 下 载 镜像 地 址 页 面 ， 单 击 Select Another Mirror 连接 可 以 
改变 下 载 镜像 地 址 ， 然 后 单 击 DOWNLOAD 按钮 开始 下 载 。 


[Te = 


eo 有 中 广 | 三 加 所 … 


© 
使 eclipse 


是 


Download from China -Unversity of Soience. 
Re 


图 2-14 选择 下 载 镜像 地 址 页 面 


@ ”Eclipse 4.6 开 发 代号 是 Neon (和 氟 气 ) ，Eclipse 开发 代号 的 首 字母 是 按照 字母 顺序 排列 的 。Eclipse 4.7 开发 
代号 是 Oxygen (氧气)。 
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下 载 完 成 后 的 文件 是 eclipse-inst-win64.exe， 事 实 上 eclipse-inst-win64.exe 可 以 安装 各 种 
Eclipse 版 本 客户 端 ， 双 击 eclipse-inst-win64.exe 弹出 如 图 2-15 所 示 的 界面 ， 选 择 Eclipse IDE 
for Java Developers 进入 如 图 2-16 所 示 的 界面 ， 在 该 界面 中 Installation Folder 处 可 以 改变 安装 
文件 夹 位 置 ， 选 中 create start menu entry 可 以 添加 快捷 方式 到 开始 菜单 ， 选 中 create desktop 
shortcut 可 以 在 桌面 创建 快捷 方式 ， 设 置 完成 后 单 击 NSTALL 按钮 开始 安装 ， 安 装 完成 后 如 
2-17 所 示 ， 单 击 LAUNCH 按钮 启动 Eclipse。 


edipseinstaller wo 3 edlipseinstaller » om z 节 | 
a 


type filter text 


ciel 


Eclipse IDE for Java EE Developers 


Installation Fokder CNWUsersv5lwark6vecipseVavaneon2 S 


Tools for Java developers creating java EE and Web applications, including a 
Java IDE, tools for Java EE, JPA, JSF, Mylyn, EGR and others, a 


rome decirop choreur 
Eclipse IDE for C/C++ Developers 


ne i 
名 Eclipse IDE for ravaserlpt and Web Developers 


any JavaScript developer, indudingjavaseript HTML 
ges suppOrt Ch cient, wr Mm 


< BAck 


图 2-15 安装 各 种 Eclipse 版 本 客户 端 图 2-16 ”Eclipse 安装 界面 


在 Eclipse 启动 过 程 中 ,会 弹出 如 图 2-18 所 示 的 选择 工作 空间 (workspace) 对 话 框 ， 工 
作 空 间 是 用 来 保存 工程 的 文件 夹 。 默 认 情 况 下 每 次 Eclipse 启动 时 都 需要 选择 工作 空间 ， 如 
果 觉 得 每 次 启动 时 都 选择 工作 空间 比较 麻烦 ， 可 以 选中 Use this as the default and to not ask 
again 选项 ， 设 置 工作 空间 的 默认 文件 夹 。 初 次 启动 Eclipse 成 功 后 ， 会 进入 如 图 2-19 所 示 


Lx 
eclipseinstaller woow Ed 
Eclipse IDE for Java Developers 
四 ， ei 
Wes 
installation Folder ”cnUsers5iworkGvedipsevavaneon2 
create start menu entry 
,creme desitop shortcut 中 5 
Select a directory as workspace 
eT ee th tore its preferen id tartifacts. 
ves the workspace dectory to store ces and development artifa 
show readme file ey! pref 
open in sysnern explorer 
Keep installer worapxe BST 可 Browse.. 


DUse this as the default and do not ask again 


《 Back 已 ]| cme | 
图 2-17 Eclipse 安装 完成 界面 图 2-18 选择 工作 空间 


wortspace java Eclipse 
dit Navigate Search Project Run Window Help 


eclipse 


姜 ReviewIDE configuratio 


Review the IDE's most fiercely conteste 


Welcome to the Eclipse IDE for Java Developers 
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售 
六 sample 
) 
© Create a new Java Edipse projet 全 
和 Bin 
< > 
图 2-19 Eclipse 欢迎 界面 


2.3.2 ”安装 PyDev 插件 


PyDev 插件 的 网 站 是 http://www.pydev.org， 不 过 需要 直接 在 网 站 上 下 载 插件 。 在 Eclipse 


工具 中 可 以 在 线 安装 插件 。 


安装 插件 过 程 如 下 ， 首 先 启动 Eclipse， 选 择 菜单 Help 一 Install New Software， 弹 出 如 图 
2-20 所 示 的 对 话 框 。 单 击 Add 按钮 弹出 如 图 2-21 所 示 对 话 框 ， 在 Location 中 输入 插件 在 线 安 
装 地 址 http://pydev.org/updates， 如 图 2-22 所 示 。 


Available Software 
Select a site or enter the location of asite. 


坦 


Work with 


Find more software by working with the “Available Software sites* preferences. 


[pe fer text 


Name 
口 @ There is no site selected. 


SelectAl .DeselectAIl | 


Details 


Show only the latest versions of available software 


回 Group items by category 
口 show only software applicable to target environment 


Contact all update sites during install to find required software 


add- 


Version 


回 Hideitemsthatare already installed 
What is already nstalled? 


=ack Next> Cancel 


图 2-20 ”安装 插件 界面 
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Name: Local.. Name: Local.. 
Location: |http:// Archive... Location: |http://pydev.org/updates Archive... 
@ OK Cancel @ ok | Cancel 
图 2-21 插件 地 址 输入 界面 图 2-22 输入 插件 地 址 


确定 输入 内 容 后 单 击 OK 按钮 关闭 对 话 ，Eclipse 通过 刚刚 输入 的 网 址 查找 插件 ， 如 果 能 
够 找到 插件 ， 则 出 现 如 图 2-23 所 示 对 话 框 ， 从 中 选择 PyDev 插件 按钮 。 选 择 完成 后 单 击 Next 
按钮 进行 安装 ， 安 装 过 程 需 要 从 网 上 下 载 插件 ， 这 个 过 程 需 要 等 一 段 时 间 。 安 装 插件 后 重新 启 


动 Eclipse 才能 生效 。 

Available software 村 
Check the items that you wish to install. 

‘Work with: ["Eclipse Project Test Site" - http//pydev.ora/updates ~][ dd | 

Find more software by working with the 'Available Software Sites" preferences. 

ltype fiter text 
Name Version 
» Dn pyoev 


» Dn PyDev Mylyn Integration (optional) 


Select All | | DeselectAll 


Details 


加 Show only the laresr versions of available software Hide items that are already installed 
回 Group items by category Whatisalready installed? 

口 Show only software applicable to target environment 

IContact all update sites during install to find required software 


® <Back | Net> | Einish Cancel 


图 2-23 ”选择 插件 安装 


2.3.3 设置 Python 解释 器 


PyDev 插件 按钮 安装 成 功 后 ， 也 需要 设置 Python 解释 器 。 具 体 步 骤 为 ， 打 开 Eclipse， 
选择 菜单 Window 一 Preferences， 弹 出 设置 对 话 框 ， 选 择 PyDev 一 Interpreters 一 Python 
Interpreter， 如 图 2-24 所 示 。 如 果 系 统 安装 好 了 Python 解释 器 ， 可 以 单 击 右 边 窗口 的 Quick 
Auto-Config 按钮 ， 如 果 能 够 成 功 找到 Python 解释 器 ， 可 见 如 图 2-25 所 示 的 对 话 框 。 但 是 如 
果 找 不 到 合适 的 Python 解释 器 ， 则 可 以 单 击 New 按钮 自己 手动 指定 Python 解释 器 的 安装 文 
件 夹 。 
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Python Interpreters cvs 
ry python interpreters (e.9: Python exe, pypy.exe]. Double -chick to rename, 
》 Code Recommenders We Locstion New- 
Gradle | 
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tnstal/Update Advanced Auto -Conig 
ya 
Maven Remove 
My wp 
> Oomph 一 一 - 
Mas Dom 
der § Packages m Libraries Forced Buihins Predefined B® Environment ® String Substitution Variables 
rey Uprary Version ne 
» Interactive Console Loading info.. -一 一 一 一 
ww pn | instalyuninstal with conda 
Wronpython interpreter nad conda em vers before nm 
Jython Interpreter 
Python Interpreter 
Logging 
Pyunit 
Rn 
Seripting PyDev 
Tosk Tags 
RuvDebug 电 Rectore Detautts| 。 Appy 
Tnam | 


图 2-24 设置 Python 解释 器 


pe er rent i pg 
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» Code Recommenders Name Location 
Grade 2 python CNkerqwin miniWppa 
Help 
InstalyUpdate 
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Packages wm Libraries Forced Builtins predefined BM Environment ® String Substitution Variables 
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~ nterpteters colorame 039 <pip> 
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Pyrhon Interpreter mecabe 061 <pip> 

iaggeg Pp rt 
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图 2-25 设置 完成 Python 解释 器 
2.3.4 设置 UTF-8 编码 


在 Windows 下 使 用 Eclipse 还 有 一 个 麻烦 的 问题 ， 在 本 章 的 开始 提 到 过 ，Eclipse 在 
Windows 平台 下 默认 字符 集 是 GBK， 如 果 在 Windows 平台 下 使 用 Eclipse 编写 Python 程序 代 
码 ， 若 代码 中 有 中 文 则 无 法 解释 运行 ， 会 出 现 如 下 错误 。 如 果 在 其 他 平台 打开 该 代码 文件 则 会 
出 现 中 文 乱码 问题 。 


File "XXX.py", line 2 

SyntaxError: Non-UTF-8 code starting with '\xc4' in file XxXX.py on line 3, but no 
encoding declared; see http://python.org/dev/peps/pep-0263/ for details 

解决 上 述 问 题 有 两 种 方案 : 

(1) 在 代码 文件 的 开头 添加 如 下 代码 指令 ， 告 诉 解释 器 采用 GBK 编码 进行 解释 。 
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# -*-coding:gbk -*- 
或 
# coding=gbk 


(2) 设置 Eclipse 编辑 文本 文件 的 默认 字符 集 为 UTF-8。 这 种 方案 不 涉及 代码 ， 本 节 介 绍 
这 种 方案 的 设置 过 程 。 

具体 步骤 : 打开 Eclipse， 选 择 菜单 Window 一 Preferences， 弹 出 设置 对 话 框 ， 选 择 General 一 
Content Types， 打 开 右 边 的 Content Types 设置 窗口 ， 如 图 2-26 所 示 ， 首 先 选 择 Text 文件 类 
型 ， 这 种 文件 类 型 包含 了 所 有 的 文本 文件 ， 然 后 在 窗口 底部 的 Default encoding 文本 框 中 输 
入 utf-8 (或 UTF-8) 设置 字符 集 ， 然 后 单 击 后 面 的 Update 按钮 设置 字符 集 。 


‘ype filter text Content Types Gro 
~ General ~ EF = 

y j See File Associations for associating editors with file types. 
Compare/Patch ee 
Content Types Images 

» Editors Java Class File 
Error Reporting WW “~~~- 

Globalization Word pocum @ 选择 Text 文 件 类 型 
Keys 

» Network Connections 
Notifications 
Perspectives 
Search 

» Security File associations: 

» Startup and Shutdown i ch pe 
UlResponsiveness Monitori |*.bc (locked) 一 -一 一 一 
User storage service 
Web Browser 顾 ] 

» Workspace 四 设 车 默认 字符 集 RE 

》Ant 二 
» Code Recommenders r 
Gradle 
» Help 吕 4 
co ， Defaultencoding:|utt-8 Update 
9@ [Cor J]| cn | 


图 2-26 设置 文本 文件 字符 集 


2.4 Visual Studio Code 开发 工具 


Visual Studio Code 是 由 微软 公司 开发 的 IDE 工 具 ， 与 微软 的 其 他 的 IDE， 如 Visual 
Studio 工具 不 同 ，Visual Studio Code 是 跨 平台 的 ， 可 以 安装 在 Windows、Linux 和 macOS 平 
台 上 运行 。Visual Studio Code 没有 限定 只 能 开发 特定 语言 程序 ， 事 实 上 只 要 安装 了 合适 的 扩 
展 (插件 )， 它 可 以 开发 任何 语言 程序 。 

Visual Studio Code 下 载 地 址 是 https://code.visualstudio.com/， 打 开 下 载 页 面 如 图 2-27 所 
示 ， 单 击 Download for Windows 按钮 可 以 下 载 Windows 的 Visual Studio Code 工具 ， 如 果 下 
载 其 他 平台 工具 可 以 单 击 Download for Windows 按钮 后 面 的 下 拉 按 钮 ， 在 下 拉 框 中 选择 不 同 
平台 的 安装 文件 ， 如 图 2-28 所 示 。 

下 载 Visual Studio Code 安装 文件 成 功 后 ， 即 可 安装 了 ， 安 装 过 程 非常 简单 ， 这 里 不 再 更 
述 。 安 装 完 成 后 启动 Visual Studio Code， 欢 迎 界面 如 图 2-29 所 示 。 刚 刚 安装 成 功 的 Visual 
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Studio Code 是 没有 Python 扩展 的 ， 可 以 在 欢迎 界面 中 安装 Python 扩展 ， 如 图 2-29 中 编号 @ 
所 示 位 置 单 击 Python 超 链接 ， 即 可 安装 Python 扩展 。 


¢ cla 女 | 到 


tps //eod 
过 Visual studio Code 4 Download 


ures and fixes fom November 


Code editing. 
Redefined. 


Download for Windows ~ 


和 (3 (eS [图 


€ Ce https//codevisualstudiocom 四 下 
过 Visual Studio Code 4 Download 
Version 119 6 now available! Read about the new features and fixes from November 


Code editing. 
Redefined. 


图 2-28 下 载 其 他 平台 Visual Studio Code 工具 


另外 ， 也 可 以 通过 单 击 如 图 2-29 中 编号 @ 处 所 示 扩 展 按钮 ， 打 开 如 图 2-30 所 示 扩 展 窗 
口 ， 在 扩展 窗口 文本 框 中 输入 python 关键 字 ， 如 图 2-30 中 编号 四 所 示 ， 这 是 在 扩展 商店 搜 
索 Python 相关 的 扩展 ， 当 找到 合适 的 扩展 ， 就 可 以 安装 了 ， 如 图 2-30 中 编号 @ 所 示 。 本 例 中 
需要 安装 Python 0.9.1， 这 是 Python 的 调试 工具 。 
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TG x 


单 击 Python 超 链接 


图 2-29 Visual Studio Code 欢迎 界面 


用- Visual Studio code 


人 找到 扩展 ， 单 击 安装 


ow 


图 2-30 安装 扩展 


安装 完成 之 后 可 以 通过 “文件 ”一 “新 建文 件 ”， 然 后 保存 文件 为 xxx. 
Visual Studio Code 工具 会 识别 出 来 这 是 一 个 Python 源 代码 文件 ， 此 


示 PyLint 没有 安装 ， 如 图 2-31 所 示 。PyLint 是 
所 示 ， 单 击 Install pylint 进行 安装 。 


可 


y 格式， 这 样 
对 Visual Studio Code 提 
的 错误 工具 ， 如 图 2-31 


来 检查 Python 代码 
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+ 


图 2-31 安装 PyLint 


2.5 文本 编辑 工具 


也 有 一 些 读者 喜欢 使 用 单纯 的 文本 编辑 工具 编写 Python 源 程序 代码 ， 然 后 再 使 用 Python 回 
解释 器 运行 。 这 种 方式 客观 上 可 以 帮助 初学 者 记 住 Python 的 一 些 关 键 字 ， 以 及 常用 的 函数 和 
类 ， 但 是 这 种 方式 用 于 实际 项 目 开发 时 ， 效 率 是 很 低 的 。 为 了 满足 不 同人 的 喜好 ， 本 节 还 是 为 四 入 
读者 推荐 一 些 开 发 Python 的 文本 编辑 工具 。 

考虑 跨 平台 开发 可 以 使 用 的 文本 编辑 工具 : 
。Sublime Text 一 一 近年 来 发 展 和 壮大 的 文本 编辑 工具 ， 所 有 的 设置 没有 图 形 界面 ， 在 
JSON 格式 ”的 文件 中 进行 的 ， 初 学 者 入 门 比 较 难 ， 官 网 为 www.sublimetext.com。 

。 UltraEdit 一 一 历史 悠久 的 强大 文本 编辑 工具 ， 可 支持 文本 列 模式 等 很 多 有 用 的 功能 ， 宣 
网 为 www.ultraedit.com。 

如 果 只 考虑 Windows 平台 开发 ， 可 以 选择 的 文本 编辑 工具 就 很 多 了 ， 常 用 如 下 : 

。Notepad++ 一 一 Notepad++ 本 意 是 Windows 平台 Notepad (记事 本 ) 的 升级 ， 但 其 功能 非 
常 强大 ， 能 够 很 好 地 支持 中 文 等 多 种 语言 ， 内 置 支持 多 达 27 种 语言 的 语法 高 亮度 显示 。 
更 重要 的 是 它 是 免费 的 。 官 网 为 www.notepad-plus-plus.org。 

。EditPlus 一 一 历史 悠久 的 强大 付费 文本 编辑 工具 ， 小 巧 、 轻 便 、 灵 活 ， 官 网 为 wwweditplus.com。 

这 些 工具 的 下 载 和 安装 都 很 简单 ， 并 且 都 支持 Python 语言 的 高 亮 显示 ， 不 需要 任何 配置 
工作 ， 因 此 每 一 种 软件 的 下 载 、 安 装 和 配置 过 程 本 节 不 再 装 述 。 


本 章 小 结 
通过 对 本 章 的 学 习 ， 读 者 可 以 掌握 Python 环境 的 拱 建 过 程 ， 熟 悉 Python 开发 的 几 个 IDE 
工具 的 下 载 、 安 装 和 配置 过 程 。 


@ JSONGavaScript Object Notation. JS 对 象 标记 ) 是 一 种 轻 量 级 的 数据 交换 格式 , 采用 键 值 对 形式 , 如 {"firstName"; 


"John"}。 


第 3 章 


本 章 以 HelloWorld 作为 切入 点 ， 介 绍 如 何 编写 和 运行 Python 程序 代码 。 
序 主要 有 两 种 方式 : 四 交互 式 方式 运行 ，@ 文 件 方式 运行 。 本 章 介绍 用 这 两 种 运 和 方式 实现 
HelloWorld 程序 。 


第 一 个 Python 程序 


3.1 使 用 Python Shell 实现 


加 进入 Python Shell 可 以 通过 交互 式 方式 编写 和 运行 Python 程序 。 启 动 Python Shell 有 以 下 
兴 三 种 方式 。 
ee (1) 单 击 Python 开始 菜单 中 Python 3.6 (64-bit).lnk 快捷 方式 文件 启动 ， 启 动 Python Shell 


界面 如 图 3-1 所 示 。 


图 3-1 快捷 方式 文件 启动 Python Shell 
(2) 进入 Python Shell 还 可 以 在 Windows 命令 提示 符 ( 即 DOS) 中 使 用 python 命令 启动 ， 
启动 命令 不 区 分 大 小 写 ， 也 没有 任何 参数 ， 启 动 后 的 界面 如 图 3-2 所 示 。 


wmcawsatenazomieoe nychon 


图 3-2 在 命令 提示 行 中 启动 Python 解释 器 
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提示 : Windows 命令 提示 符 在 Linux、UNIX 和 macOS 称 为 终端 ( Terminal)， 


在 Linux、 


UNIX 和 macOS 平台 终端 中 python 命令 必须 是 小 写 的 。 在 预先 安装 了 Python 2 和 Python 3 两 
个 版 本 的 Linux、UNIX 和 macOS 系统 ， 上 默认 python 命令 启动 Python 2 解释 器 ， 启 动 Python 


3 解释 器 的 命令 是 python3。 


(3) 通过 Python IDLE 启动 Python Shell， 如 图 3-3 所 示 。Python IDLE 提供 了 简单 的 文 


本 编辑 功能 ， 如 剪 切 、 复 制 、 


粘贴 、 撤 销 和 重 做 等 ， 且 支持 语法 高 亮 显示 。 


Fle Edh Shell Debvg Optom Wndow 
Python 3.6.4 (v3.6.4: eceb, Dec 19 2017, 06:54:40) [MSC v.1900 64 
bit (AMD64)] on,win32 


Type “copyright”, 


“credits” or “license()” for more information. 


my cord 


图 3-3 IDLE 工具 启动 Python Shell 


无 论 采 用 哪 一 种 方式 启动 Python Shell， 其 命令 提示 符 都 是 “ 


以 输入 Python 语句 ， 然 后 按 下 Enter 键 就 可 以 ; 
如 图 3-4 所 示 是 执行 几 条 Python 语句 示例 。 


二 


运行 Python 


>>>” 在 该 命令 提示 符 后 可 
语句 ，Python Shell 马上 输出 结果 。 


Fie Fd Shel Debog Opton Wndow Melp 


Python 3.6.4 (v3.6.4:d48eceb, Dec 19 2017, 


MD64)] on win32 
Type “copyright”, 


>>> print (“Hello World. “) 
Hello World. 

》>> 1+1 

VE 
> >> print (str) 
Hello, World. 


“Hello，World 


06:54:40) [MSC v.1900 64 bit (A ”| 


“credits” or “license()” for more information. 


图 3-4 在 Python Shell 中 执行 Python 语句 


3-4 所 示 Python Shell 中 执行 的 Python 语句 解释 说 明 如 下 : 


>>> print ("Hello World.") 
Hello World. 


将 

>>> str = "Hello，World." 
>>> print (str) 

Hello, World. 

>>> 

代码 第 四 行 、 第 图 行 、 


@ 行 是 运行 结果 。 


Gegeoe@ee 


第 @ 行 和 第 @ 行 是 Python 语句 或 表达 式 ， 而 第 @ 行 、 第 @ 行 和 第 
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3.2 使 用 PyCharm 实现 


上 一 节 介绍 了 如 何 使 用 Python Shell 以 交互 方式 运行 Python 代码 。 而 交互 方式 运行 在 很 
多 情况 下 适合 学 习 Python 语言 的 初级 阶段 ， 它 不 能 保存 执行 的 Python 文件 。 如 果 要 开发 复杂 
pe 的 案例 或 实际 项 目 ， 交 互 方式 运行 就 不 适合 了 。 此 时 ， 可 以 使 用 IDE 工具 ， 通 过 这 些 工具 创 
建 项 目 和 Python 文件 ， 然 后 再 解释 运行 文件 。 

3.2 节 介 绍 如 何 使 用 PyCharm 创建 Python 项目、 编写 Python 文件 ， 以 及 运行 Python 文件 。 


3.2.1 创建 项 目 


首先 在 PyCharm 中 通过 项 目 (Projecb 管理 Python 源 代码 文件 ， 因 此 需要 先 创 建 一 个 
Python 项 目 ， 然 后 在 项 目 中 创建 一 个 Python 源 代码 文件 。 

PyCharm 创建 项 目 步骤 是 : 打开 如 图 3-5 所 示 PyCharm 的 欢迎 界面 ， 在 欢迎 界面 单 击 
Create New Project 按钮 或 通过 选择 菜单 File 一 New Project 打开 如 图 3-6 所 示 的 对 话 框 ， 在 
Location 文本 框 中 输入 项 目 名 称 HelloProj。 如 果 没 有 设置 Python 解释 器 或 想 更 换 解释 器 ， 则 
可 以 单 击 图 3-6 所 示 的 三 角 按钮 展开 Python 解释 器 设置 界面 ， 如 图 3-7 所 示 。 


加 


PyCharm 


类 Create New Project 
Open 


$ Check out trom Version Control ~ 


亲 Configure 。 GetHelp» 


图 3-5 PyCharm 欢迎 界面 
[ENesproee | 


Location: CAUsersvtony pycharmprojec rs] 
Project Interpreter New Virualen envronment 


图 3-6 创建 项 目 
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Location: [C\Users\tony\pycharmprojects\Hellopro) 概 


™ Project Interpreter: Python 36 一 ss = = = 


O Newenvironment using | 二 Vi 


Location: CNUserswonywpycharmprajectsvHelloprojvenv 


Base interpreter [只 CNUsersironXAPFDetaLccalErcgramzPythonEyzhon36tpythonexe 
口 mheritglobal site-packages 
CE Make avallable to all projects 


图 Bisting interpreter 


Interpreter [® Python 3.6 CNUsersenyAppDabytocalPrognmepymonWpyhonawpymonexe |] 将 | 


[rrr | 


图 3-7 选择 项 目 解释 器 
如 果 输 入 好 项 目 名 称 ， 并 选择 好 了 项 目 解释 器 就 可 以 单 击 Create 按钮 创建 项 目 ， 如 图 3-8 
所 示 。 


Ele Edit Wew Navigate Code Befctor Run Iook VCS Window Hetp 
Helloproj 


图 3-8 项 目 创建 完成 


3.2.2 ”创建 Python 代码 文件 


项 目 创建 完成 后 ， 需 要 创建 一 个 Python 代码 文件 执行 控制 
台 输 出 操作 。 选 择 刚刚 创建 的 项 目 中 Helloproj 文件 夹 ， 然 后 右 
键 选择 New 一 Python file 菜单 ， 打 开 新 建 Python 文件 对 话 框 ， 
如 图 3-9 所 示 ， 在 对 话 框 中 Name 文本 框 中 输入 hello， 然 后 单 击 
图 3-9 新 建 on 文件 对 话 框 
OK 按钮 创建 文件 ， 如 图 3-10 所 示 ， 在 左边 的 项 目 文件 管理 窗口 
中 可 以 看 到 刚刚 创建 的 hello py 源 代 码 文件 。 
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有 Helioproj ,项 hetopy Hello (DY [Lo 1Ql 
| 加 was FER ER 


司 


> Ml Bremal Libraries 


图 3-10 hello.py 源 代码 文件 


3.2.3 ”编写 代码 

Python 代码 文件 运行 类 似 于 Swift， 不 需要 Java 或 C 的 main 主 函 数 ，Python 解释 器 从 上 
到 下 解释 运行 代码 文件 。 

编写 代码 如 下 : 


string = "Hello, World." 
print (string) 


3.2.4 运行 程序 
程序 编写 完成 后 就 可 以 运行 了 。 如 果 是 第 一 次 运行 ， 则 需要 在 左边 的 项 目 文件 管理 窗口 中 
选择 hello.py 文件 ， 右 击 菜单 中 选择 Run 'hello' 运行 ， 运 行 结果 如 图 3-11 所 示 ， 在 左下 面 的 控 
制 台 窗口 输出 Hello, World. 字符 串 。 


Ble Et Yew Navigate Code Refactor Run Tooks VCS Window Help 
有 a Helloproj 坊 heliopy me pn a 
pet + EE 
~ Wa Holoproj Cscrswn mipychermpr ocd I 可 
| 2 string = "Hello, World." 

3 print(string) 

4 


C:\Users\win-mini\AppData\Local\Programs\Python\Python36\ 
Hello, World. 


Process finished with exit code 9 


是. | 


图 3-11 运行 结果 


注意 : 如 果 已 经 运行 过 一 次 ， 也 可 直接 单 击 工具 栏 中 的 Run 月 按钮 ， 或 选择 菜单 
Run 一 Run 'hello'， 或 使 用 快捷 键 ShifttF10， 都 可 以 运行 上 次 的 程序 。 


3.3 使 用 Eclipse+PyDev 插件 实现 


本 节 介 绍 如何 通 过 Eclipse+PyDerv 插件 实现 编写 和 
运行 HelloWorld 程序 。 


3.3.1 创建 项 目 


在 Eclipse 中 也 是 通过 项 目 管理 Python 源 代码 文件 
的 ， 因 此 需要 先 创建 一 个 Python 项目， 然后 在 项 目 中 
创建 一 个 Python 源 代码 文件 。 

Eclipse 创建 项 目 步骤 是 : 打开 Eclipse， 选 择 菜单 
File 一 New 一 PyDev Project， 打 开 如 图 3-12 所 示 的 
对 话 框 ， 在 这 里 可 以 输入 项 目 名 HelloProj， 注 意 选 中 
Create 'src' folder and add it to the PYTHONPATH 选 项 ， 
这 会 在 项 目 中 增加 src 文件 夹 ， 代 码 文件 会 放 到 这 个 文 
件 夹 中 ， 同 时 会 将 src 文件 夹 添加 到 PYTHONPATH 环 
境 变量 中 。 

其 他 保持 默认 值 ， 然 后 单 击 Finish 按钮 创建 项 
目 。 项 目 创建 完 成 后 ， 回 到 如 图 3-13 所 示 的 Eclipse 
主 界面 。 


File Edit Navigate Search Project Pydev Run Window Help 
[ET 
pyDev Package Ex 1 
日 包 | 委 
| ~ Hellopro) 

sre 


@ python (CAUsers -. thona 


DConsole 三 
No consoles to display at this time. 


IE 
1 htem selected 


PyDev Project 
Create a new pyDev Project. 


第 3 章 第 一 个 Python 程序 | 其 27 


Project name [HelloProj 


Project contents: 
Use detault 
rectory ERROR 
Project ype 
Choose the project 
图 Python OJython Oronpython 
Grammar Version 


Be 
ER 


| Ee 


Additional syntax validation: <no additional grammars selected>. 


OAdd project directory to the PYTHONPATH 

@ Create sre folder and add itto the PYTHONPATH 

Ocresl inks to existing sources (select them on the next poge) 

O Dogt configure PYTHONPATH (to be done manually ater on 
Working sets 


Ohadproject to worting ens 
da 


1 
选中 该 选项 


2 | eas 


8 


CD 


om |E 
does 了 aa 


Cancel 


图 3-12 输入 项 目 名 和 保存 项 目 


[Quceacces]ji 91 周 


ine 


A267-H-=o 


图 3-13 项目 创建 完成 


3.3.2 ”创建 Python 代码 文件 


项 目 创建 完成 后 ， 需 要 创建 一 个 Python 代码 文件 执行 控制 台 输 出 操作 。 选 择 刚 刚 创建 
的 项 目 ， 选 中 项 目 中 src 文件 夹 ， 然 后 选择 菜单 File 一 New 一 PyDev Module， 打 开创 建 
文件 Module (模块 ) 对 话 框 ， 在 Python 中 一 个 模块 就 是 一 个 文件 ， 如 图 3-14 所 示 ， 在 模 
块 对 话 框 的 Name 文本 框 中 输入 hello， 这 是 模块 名 ， 也 是 文件 命名 。 另 外 ，Package 文本 
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框 中 输入 的 是 该 文件 所 在 的 包 ， 有 关 包 的 概念 将 在 第 4 章 详 细 介 绍 ， 在 这 里 先 不 输入 任何 
的 包 名 。 最 后 单 击 Finish 按钮 创建 文件 ， 此 时 会 弹出 文件 模板 选择 对 话 框 ， 如 图 3-15 所 


示 ， 本 例 中 选择 <Empty> 即 空 模板 ， 然 后 单 击 OK 按钮 创建 文件 ， 回 到 如 图 3-16 所 示 的 
Eclipse 主 界面 。 


Template 
Emp 
Module: CL (argparse) 
em amt ode 号 Module: CU (optparse) 
Module: Class 
Module: Main 
- Module: Unittest 
Source Folder |/Helloproj/src Browse-… Module UniaaatwaiaatipanadtaaDaum 
Package Browse.. 
Name hellal 
Config available templates.., 
® Eee © Ce ee 
图 3-14 ”创建 模块 对 话 框 图 3-15 ”选择 模板 


上 | 网 网 | 四 i 扣 ~Ovqvi 了 7 


Goesacce | 中 | 电 国 杂 


[EpyDevPackage Ex.. ™ “口罩 "hellos 有 SEEonnes ”= 
名 | 从 1 CLE 

~ Helloproj ype ier te 

四 src 2 Created on 281871 /J18H 


Dhellopy 3 
pnhon (eeen thon 4 @author: 交 贡 下 
Sr 


6 


Console 呈 


He"H--0 
No consoles to display at this time. 


Witable | meert G21 


图 3-16 文件 创建 完成 


3.3.3 ”运行 程序 


修改 刚刚 创建 的 hello.py 代码 文件 ， 代 码 如 图 3-17 所 示 。 

程序 编写 完成 后 就 可 以 运行 了 。 如 果 是 第 一 次 运行 ， 则 需要 选择 运行 方法 ， 具 体 步 又 
是 : 选中 文件 ， 选 择 菜单 Run 一 Run As 一 Python Run， 这 样 就 会 运行 Python 程序 了 。 如 果 
已 经 运行 过 程序 一 次 ， 就 不 需要 这 么 麻烦 了 ， 直 接 单 击 工具 栏 中 的 Run @@ 按 钮 ， 或 选择 菜单 


Run 一 Run， 或 使 用 快捷 键 Ctrl+F11， 都 可 以 运行 上 次 的 程序 。 运 行 结 果 如 图 3-18 所 示 ， 输 
出 Hello, World. 字符 串 到 下 面 的 控制 台 窗 口 。 
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Fle Edit Source Refactoring Navigate Search Project Pydev Run Window Help 


ED [Qua Access]! 9|e 半 # 
3 pyDev Package Ex.. hello = Bounes 一 
a AX 
eg peferten | 
i 2 Created on 2818 持 1 有 8 万 0 suing 
Bhelopy 
prton Gsers -ao 4 Bauthor; 尖 闪 放 
Se 
6 


7 string = "HeLLo, WorLd.” 
3 print(string) 
9 


Console s 
No consoles to display at this time. 


图 3-17 编写 hello.py 源 文件 


~ S Hellopr 
Se 2 Created on 2018 $1/1184 


Bhelopy 3 

© pron asers -am 4 @author: 
i 
6 


7 string = “HelLLo, World.” 
8 print(string) 
党 


Console 3 EL LEE 
<terminated> hello py [C'\Users\win-minMAppData\ ocal\Programs\Python\python36\python exe] 
Hello, World. 


图 3-18 运行 结果 


3.4 使 用 Visual Studio Code 实现 


使 用 Visual Studio Code 可 以 不 用 创建 项 目 ， 直 接 创建 文件 即 可 。 
3.4.1 创建 Python 代码 文件 ne 


Visual Studio Code 欢迎 界面 如 图 3-19 所 示 ， 单 击 “ 新 建文 件 ” 按 钮 可 以 创建 新 文件 ， 或 
通过 菜单 “文件 ”一 “新 建文 件 ” 创 建新 文件 。 新 文件 没有 文件 类 型 ， 所 以 在 编写 代码 之 前 
应 该 先 保存 为 hello.py 文件 ， 如 图 3-20 所 示 ， 这 样 Visual Studio Code 工具 能 够 识别 出 来 这 是 
Python 代码 文件 ， 语 法 才能 高 亮 显示 。 
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文件 (F) 顽 铀 (E) 选 


3.4.2 ”运行 程序 


修改 刚刚 创建 的 hello.py 代码 文件 


) 


TE FHS 3 


图 3-19 创建 文件 


诗坛 (D) 任务 ( 带 助 (H) 


hellopy x 


行 1, 列 1 空格 :4 UTF8 CRLF Python 


图 3-20 文件 创建 完成 


F， 代 码 如 图 3-21 所 示 。 


加 


程序 编写 完成 后 就 可 以 运行 了 。 具 体 步 又 是 : 选择 菜单 “调试 ”一 “ 非 调试 启动 ”” 这样 


就 会 运行 Python 程序 了 ， 或 使 
所 示 ， 输 出 Hello, World. 字符 


到 下 下 


面 的 控制 台 窗 口 。 


键 Ctrl+F5 也 可 以 运行 Python 程序 。 运 


行 结果 如 图 3-22 
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打开 文件 夹 


4 UF CR prho @ 


Hollo, World. 


行 9, 列 1 空谷 4 UIF8 CRLF Pyhon 人 @ 


图 3-22 ”运行 结果 


3.5 文本 编辑 工具 +Python 解释 器 实现 


如 果 不 想 使 用 IDE 工具 ， 那 么 文本 编辑 工具 +Python 解释 器 对 于 初学 者 而 言 是 一 个 不 错 
的 选择 ， 这 种 方式 可 以 使 初学 者 了 解 到 Python 运行 过 程 ， 通 过 自己 在 编辑 器 中 敲 入 所 有 代码 ， 确 
可 以 帮助 熟悉 关键 字 、 函 数 和 类 ， 能 快速 掌握 Python 语法 。 各 

3.5.1 编写 代码 


首先 使 用 任何 文本 编辑 工具 创建 一 个 文件 ， 然 后 将 文件 保存 为 hello.py。 接 着 在 hello.py 
文件 中 编写 如 下 代码 。 
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Created on 2018 年 1 月 18 日 
作者 : 关东 升 


string = "Hello, World." 
print (string) 


fun main(args: Array<string>) { 
println("Hello, world!") 
} 


3.5.2 ”运行 程序 


要 想 运 行 上 一 节 编 写 的 hello.py 文件 ， 可 以 在 Windows 命令 提示 符 (Linux 和 UNIX 终端 ) 
bh 通过 Python 解释 器 指令 实现 ， 具 体 指令 如 下 : 


天 


python hello.py 


运行 过 程 如 图 3-23 所 示 。 

有 的 文本 编辑 器 可 以 直接 运行 Python 文件 ， 例 如 
Sublime Text 工具 不 需要 安装 任何 插件 和 设置 ， 就 可 
以 直接 运行 Python 文件 。 使 用 Sublime Text 工具 打开 
Python 文件 ， 通 过 菜单 Tools 一 Build， 或 使 用 快捷 键 
Ctrl+B 就 可 以 运行 文件 了 ， 结 果 如 图 3-24 所 示 。 图 3-23 Python 解释 器 运行 文件 


string "Hello, World.”" 
print(string) 


Hello, World. 
[Finished in 9.2s] 


iret cam Se ae | 


图 3-24 在 Sublime Text 中 运行 Python 文件 


3.6 ”代码 解释 


至 此 只 是 介绍 了 如 何 编写 和 运行 HelloWorld 程序 ， 还 没有 对 HelloWorld 程序 代码 进行 
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me @ 
Created on 2018 年 1 月 18 日 

作者 : 关东 升 

i @ 
string = "Hello, World." @ 
print (string) @ 


从 代码 中 可 见 ，Python 实现 HelloWorld 的 方式 比 Java、C 和 C++ 等 语言 要 简单 得 多 ， 而 
且 没 有 main 主 函 数 。 下 面 详细 解释 一 下 代码 。 

代码 第 四 行 和 第 @@ 行 之 间 使 用 两 对 三 重 单 引号 包 于 起 来 ， 这 是 Python 文档 字符 串 ， 起 到 
对 文档 注释 的 作用 。 三 重 单 引号 可 以 换 成 三 重 双 引号 。 代 码 第 @ 行 是 声明 字符 串 变 量 string， 
并 且 使 用 "Hello, World." 为 它 赋 值 。 代 码 第 @ 行 是 通过 print 函数 将 字符 串 输出 到 控制 台 ， 类 
似 于 C 中 的 printf 函数 。print 函数 语法 如 下 : 


print (*objects, sep=' ', end='\n', file=sys.stdout, flush=False) 


print 函数 有 五 个 参数 ，*objects 是 可 变 长 度 的 对 象 参 数 ，sep 是 分 隔 符 参 数 ， 默 认 值 是 一 
个 空格 ; end 是 输出 字符 串 之 后 的 结束 符号 ， 默 认 值 是 换 号 符 ， file 是 输出 文件 参数 ， 默 认 值 
sys.stdout 是 标准 输出 ， 即 控制 台 ; flush 为 是 否 刷新 文件 输出 流 缓冲 区 ， 如 果 刷 新 字符 串 会 马 
上 打印 输出 默认 值 不 刷新 。 

使 用 sep 和 end 参数 的 print 函数 示例 如 下 : 

>>> print('Hello', end = ',') 

Hello, 

>>> print (20, 18, 39, 'Hello', ‘'World', sep = "|') 

201181391HellolWorld 

>>> print (20, 18, 39, 'Hello'， "World'，sep = '|', end = ',') 

201181391HellolWorld， 


上 述 代码 中 第 @ 行 用 逗号 “,” 作 为 输出 字符 串 之 后 的 结束 符号 。 代 码 中 第 @ 行 用 竖 线 “|” 
作为 分 隔 符 。 


本 章 小 结 


本 章 通 过 一 个 HelloWorld 示例 ， 使 读者 了 解 到 什么 是 Python Shell，Python 如 何 启动 
Python Shell 环境 。 然 后 介绍 如 何 使 用 PyCharm、Eclipse+PyDev 和 Visual Studio Code 工具 实 
现 该 示例 具体 过 程 。 此 外 ， 还 介绍 了 使 用 文本 编辑 器 +Python 解释 器 的 实现 过 程 。 


Python 语法 基础 


本 章 主要 介绍 Python 中 一 些 最 基础 的 语法 ， 其 中 包括 标识 符 、 关 键 字 、 常 量 、 变 量 、 表 
达 式 、 语 句 、 注 释 、 模 块 和 包 等 内 容 。 


4.1 标识 符 和 关键 字 


任何 一 种 计算 机 语言 都 离 不 开标 识 符 和 关键 字 ， 因 此 下 面 将 详细 介绍 Python 标识 符 和 
关键 字 。 


回 
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标识 符 就 是 变量 、 常 量 、 函 数 、 属 性 、 类 、 模 块 和 包 等 由 程序 员 指 定 的 名 字 。 构 成 标识 符 
的 字符 均 有 一 定 的 规范 ，Python 语言 中 标识 符 的 命名 规则 如 下 : 

(1) 区 分 大 小 写 ，Myname 与 myname 是 两 个 不 同 的 标识 符 ; 

(2) 首 字 符 可 以 是 下 夯 线 “_” 或 字母 ， 但 不 能 是 数字 ; 

(3) 除 首 字 符 外 其 他 字符 ， 可 以 是 下 画 线 “_” 字母 和 数字 ; 

(4) 关键 字 不 能 作为 标识 符 ; 

(5) 不 能 使 用 Python 内 置 函 数 作 为 自己 的 标识 符 。 

例如 ， 身 高 、identifier、userName、User_Name、_sys_val 等 为 合法 的 标识 符 ， 注 意 中 文 “ 身 
高 ”命名 的 变量 是 合法 的 ， 而 2mail、room#、$Name 和 class 为 非法 的 标识 符 ， 注 意 # 和 8$ 不 
能 构成 标识 符 。 


4.1.2 ”关键 字 


关键 字 是 类 似 于 标识 符 的 字符 序列 ， 由 语言 本 身 定义 好 。Python 语言 中 有 33 个 关键 字 ， 
只 有 三 个 ， 即 False、None 和 True 首 字母 大 写 ， 其 他 的 全 部 小 写 。 具 体内 容 见 表 4-1 所 示 。 


表 4-1 Python 关键 字 


elif 


else 


lambda 


except 
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续 表 


break for not 
class from or 
continue global pass 


4.2 变量 和 常量 


上 一 章 中 介绍 了 如 何 编写 一 个 Python 小 程序 ， 其 中 就 用 到 了 变量 。 常 量 和 变量 是 构成 表 网 
达 式 的 重要 组 成 部 分 。 
4.2.1 变量 和 码 看 和 上 


在 Python 中 声明 变量 时 不 需要 指定 它 的 数据 类 型 ， 只 要 是 给 一 个 标识 符 赋值 就 声明 了 变 
示例 代码 如 下 : 


# 代码 文件 ， chapter4/src/ch4.2.1.kt 


站 


_hello = "HelloWorld" 
score_ for student = 0.0 
Y 20 

Y True 


代码 第 @@ 行 、 第 @ 行 和 第 @ 行 分 别 声 明了 三 个 变量 ， 这 些 变 量 声明 不 需要 指定 数据 类 型 ， 
你 赋 给 它 什 么 数值 ， 它 就 是 该 类 型 变量 了 。 注 意 代码 第 @ 行 是 给 y 变量 赋 布 尔 值 True， 虽 然 了 
已 经 保存 了 整数 类 型 20， 但 它 也 可 以 接收 其 他 类 型 数据 。 


提示 : Python 是 动态 类 型 语言 Q， 它 不 会 检查 数据 类 型 ， 在 变量 声明 时 不 需要 指定 数据 类 
型 。 这 一 点 与 Swift 和 Kotlin 语言 不 同 ，Swift 和 Kotlin 虽然 在 声明 变量 时 也 可 以 不 指定 数据 
类 型 ， 但 是 它们 的 编译 器 会 自动 推导 出 该 变量 的 数据 类 型 ， 一 旦 该 变量 确定 了 数据 类 型 ， 就 不 
能 再 接收 其 他 类 型 数据 了 。 而 Python 的 变量 可 以 接收 其 他 类 型 数据 。 


@@@e 


4.2.2 ”常量 


在 很 多 语言 中 常量 的 定义 是 一 旦 初始 化 后 就 不 能 再 被 修改 的 。 而 Python 不 能 从 语法 层面 
上 定义 常量 ，Python 没有 提供 一 个 关键 字 使 得 变量 不 能 被 修改 。 所 以 在 Python 中 只 能 将 变量 
当成 常量 使 用 ， 只 是 不 要 修改 它 。 那 么 这 就 带 来 了 一 个 问题 ， 变 量 可 能 会 在 无 意 中 被 修改 ， 从 
而 引发 程序 错误 。 解 决 此 问题 要 么 靠 程序 员 自 律 和 自 查 ， 要 么 通过 一 些 技术 手段 使 变量 不 能 
修改 。 


提示 : Python 作为 解释 性 动态 语言 ， 很 多 情况 下 代码 安全 需要 靠 程序 员 自 查 。 而 Java 和 
C 等 静态 类 型 语言 的 这 些 问 题 会 在 编译 期 被 检查 出 来 。 


@ 动态 类 型 语言 会 在 运行 期 检查 变量 或 表达 式 数据 类 型 ， 主 要 有 Python、PHP 和 Objective-C 等 。 与 动态 语言 
对 应 的 还 有 静态 类 型 语言 ， 静 态 类 型 语言 会 在 编译 期 检查 变量 或 表达 式 数据 类 型 ， 如 Java 和 C++ 等 。 
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回 
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4.3 注释 


Python 程序 注释 使 用 井 号 “# ”， 使 用 时 # 位 于 注释 行 的 开头 ，# 后 面 有 一 个 空格 ， 接 着 是 
注释 内 容 。 

另外 ， 在 第 3 章 还 介绍 过 文档 字符 串 ， 它 也 是 一 种 注释 ， 只 是 用 来 注释 文档 的 ， 文 档 注释 
将 在 第 5 章 详细 介绍 。 

使 用 注释 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 chapter4/4.3/hello.py 


# _hello = "HelloWorld" 
# score_ for student = 0.0 


©S@ © © 


y= 20 
y = "大 家 好 " 


print(y)  # 打印 y 变量 © 


代码 第 四 行 和 第 @ 行 中 的 # 号 是 进行 单行 注释 ，# 号 也 可 连续 注释 多 行 ， 见 代码 第 @ 行 和 
第 图 行 ， 还 可 以 在 一 条 语句 的 尾 端 进行 注释 ， 见 代码 第 @ 行 。 注 意 代 码 第 四 行 # coding=utf-8 
的 注释 作用 很 特殊 ， 是 设置 Python 代码 文件 的 编码 集 ， 该 注释 语句 必须 放 在 文件 的 第 一 行 或 
第 二 行 才 能 有 效 ， 它 还 有 替代 写法 : 

#!/usr/bin/python 

# -*- coding: utf-8 一 * 一 

其 中 #/usr/bin/python 注释 是 在 UNIX、Linux 和 macOS 等 平台 上 安装 多 个 Python 版 本 时 ， 
具体 指定 哪个 版 本 的 Python 解释 器 。 


提示 : 在 PyCharm 和 Sublime Text 工具 中 注释 可 以 使 用 快捷 键 ， 在 Windows 系统 下 的 具 
体 步 骤 是 : 选择 一 行 或 多 行 代码 然 后 按 住 “Ctrl+ 斜 本 ”组 合 键 进行 注释 。 去 掉 注 释 也 是 选中 代 
码 后 按 住 “Ctrl+ 斜 本 ”组 合 键 。 

注意 : 在 程序 代码 中 ， 对 容易 引起 误解 的 代码 进行 注释 是 必要 的 ， 但 应 避免 对 已 清晰 表达 
信息 的 代码 进行 注释 。 需 要 注意 的 是 ， 频 繁 地 注释 有 时 反映 了 代码 的 低 质 量 。 当 觉得 被 迫 要 加 
注释 的 时 候 ， 不 妨 考 虑 一 下 重 写 代码 使 其 更 清晰 。 


4.4 语句 


了 Python 代码 是 由 关键 字 、 标 识 符 、 表 达 式 和 语句 等 内 容 构成 的 ， 语 句 是 代码 的 重要 组 成 部 分 。 
语句 关注 代码 的 执行 过 程 ， 如 过 、for 和 while 等 。 在 Python 语言 中 ， 一 行 代码 表示 一 条 


语句 ， 语 句 结束 可 以 加 分 号 ， 也 可 以 省 略 分 号 。 


示例 代码 : 


# coding=utf-8 
# 代码 文件 : chapter4/4.4/hello.py 
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_hello = "HelloWorld" 


score for student = 0.0; ## 没有 错误 发 生 
y= 20 
namel = "Tom"; name2 = "Tony" O 


提示 : 从 编程 规范 的 角度 讲 ， 语 句 结束 不 需要 加 分 号 ， 而 且 每 行 至 多 包含 一 条 语句 。 代 码 
第 中 行 的 写法 是 不 规范 的 ， 推 荐 使 用 : 


namel "Tom" 


name2 “ong™ 


Python 还 支持 链 式 赋值 语句 ， 如 果 需 要 为 多 个 变量 赋 相 同 的 数值 ， 可 以 表示 为 
a=b=c=10 
这 条 语句 是 把 整数 10 赋值 给 a、b、c 三 个 变量 。 


另外 ， 在 过、for 和 while 代码 块 的 语句 中 ， 代 码 块 不 是 通过 大 括号 来 界定 的 ， 而 是 通过 缩 
缩 进 在 一 个 级 别 的 代码 在 相同 的 代码 块 中 。 


# coding=utf-8 
# 代码 文件 ， chapter4/4.4/hello.py 


进 


_hello = "HelloWorld" 
score_for_student = 10.0; # 没有 错误 发 生 
y= 20 


namel = "Tom"; name2 = "Tony" 
# 链 式 赋值 语句 
b= 6 = 10 


if yy > 10: 

Print (y) 

print(score for_student) 
else: 

print(y * 10) 


©© ©o 


print(_hello) 


代码 第 中行 和 第 @ 行 是 同一 个 缩 进 级 别 ， 它 们 在 相同 的 代码 块 中 。 而 代码 第 图 行 和 第 四 行 
不 在 同一 个 缩 进 级 别 中 ， 它 们 在 不 同 的 代码 块 中 。 

提示 : 一 个 缩 进 级 别 一 般 是 一 个 制 表 符 (Tab) 或 4 个 空格 ， 考 虑 到 不 同 的 编辑 器 制 表 符 
显示 的 宽度 不 同 ， 大 部 分 编程 语言 规范 推荐 使 用 4 个 空格 作为 一 个 缩 进 级 别 。 


4.5 模块 


Python 中 一 个 模块 就 是 一 个 文件 ， 模 块 是 保存 代码 的 最 小 单位 ， 模 块 中 可 以 声明 变 图 
量 、 常 量 、 函 数 、 属 性 和 类 等 Python 程序 元 素 。 一 个 模块 提供 可 以 访问 另外 一 个 模块 中 的 氏 
程序 元 素 。 
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下 面 通过 示例 介绍 模块 的 使 用 。 现 有 两 个 模块 modulel 和 hello。modulel 模块 代码 : 


# coding=utf-8 
# ”代码 文件 : chapter4/4.5/modulel.py 


y = True 


z= 10.10 


print (' 进入 modulel 模块 ') 


hello 模块 会 访问 modulel 模块 的 变量 ，hello 模块 代码 : 


# coding=utf-8 
# 代码 文件 : chapter4/4.5/hello.py 


import modulel [0) 
from modulel import z @ 
y= 20 

print (y) # 访问 当前 模块 变量 y @ 
print (modulel.y) # 访问 modulel 模块 变量 y @ 
print (z) # 访问 modulel 模块 变量 z © 


上 述 代 码 中 hello 模块 要 访问 modulel 模块 的 变量 y 和 z。 为 了 实现 这 个 目的 ， 可 以 通过 
两 种 import 语句 导入 模块 modulel 中 的 代码 元 素 。 

。，import < 模块 名 >， 见 代码 第 四 行 。 这 种 方式 会 导入 模块 所 有 代码 元 素 ， 访 问 时 需要 
加 “模块 名 .”， 见 代码 第 @ 行 modulel.y，modulel 是 模块 名 ，y 是 模块 modulel 中 的 
变量 。 

，from < 模块 名 > import < 代码 元 素 >， 见 代码 第 @@ 行 。 这 种 方式 只 是 导入 特定 的 代码 元 
素 ， 访 问 时 不 需要 加 “模块 名 .”， 见 代码 第 @ 行 z 变量 。 但 是 需要 注意 ， 当 z 变量 在 当 
前 模块 中 也 有 时 ，z 不 能 导入 ， 即 z 是 当前 模块 中 的 变量 。 

运行 hello.py 代码 输出 结果 如 下 : 


进入 modulel 模块 


从 运行 结果 可 见 ，import 语句 会 运行 导入 的 模块 ， 注 意 示例 中 使 用 了 两 次 import 语句 ， 
但 只 执行 一 次 模块 内 容 。 

模块 事实 上 提供 一 种 命名 空间 (namespace) ”。 同 一 个 模块 内 部 不 能 有 相同 名 字 的 代码 元 
素 ， 但 是 不 同 模块 可 以 ， 上 述 示例 中 的 y 命 名 的 变量 就 在 两 个 模块 中 都 有 。 


@ 命名 空间 ， 也 称 名 字 空 间 、 名 称 空间 等 ， 它 表示 着 一 个 标识 符 〈identifier) 的 可 见 范围 。 一 个 标识 符 可 在 多 

个 命名 空间 中 定义 ， 它 在 不 同 命名 空间 中 的 含义 是 互 不 相干 的 。 这 样 ， 在 一 个 新 的 命名 空间 中 可 定义 任何 标识 符 ， 它 
们 不 会 与 任何 已 有 的 标识 符 发 生 冲 突 ， 因 为 已 有 的 定义 都 处 于 其 他 命名 空间 中 。 

一 一 引 自 维基 百科 https://zh.wikipedia.org/wiki/ 命名 空间 
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4.6 包 


如 果 有 两 个 相同 名 字 的 模块 ， 应 如 何 防止 命名 冲突 呢 ? 那 就 是 使 用 包 (package)， 很 多 语 加 8 
言 都 提供 了 包 ， 例 如 Java、Kotlin 等 ， 它 们 的 作用 都 是 一 样 的 ， 即 提供 一 种 命名 空间 。 | 


4.6.1 创建 包 扫 码 看 视频 


重 构 4.5 节 示 例 ， 现 有 两 个 hello 模块 ， 它 们 放 在 不 同 的 包 com.pkgl 和 com.pkg2 中 ， 如 
4-1 所 示 ， 从 图 中 可 见 包 是 按照 文件 夹 的 层次 结构 管理 的 ， 而 且 每 个 包 下 面 会 有 一 个 _init _ 
.py 文件 ， 它 告诉 解释 器 这 是 一 个 包 ， 这 个 文件 内 容 一 般 情 况 下 是 空 的 ， 但 可 以 编写 代码 。 

既然 包 是 一 个 文件 夹 加 上 一 个 空 的 _init .py 文件 ， 那 么 开发 人 员 就 可 以 自己 在 资源 管 
理 器 中 创建 包 。 笔 者 推荐 使 用 PyCharm 工具 创建 ， 它 在 创建 文件 夹 的 同时 还 会 创建 一 个 空 的 
_init .py 文件 。 

具体 步骤 : 使 用 PyCharm 打开 创建 的 项 目 ， 右 击 项 目 选 择 New 一 Python Package 菜单 ， 
如 图 4-2 所 示 ， 在 弹出 对 话 框 中 输入 包 名 com.pkg， 其 中 com 是 一 个 包 ，pkg 是 它 的 下 一 个 层 
次 的 包 ， 中 间 用 点 “.” 符 号 分 隔 。 


Y 加 com < -- com 包 
v 加 pkg1 人 ---------- com.pkg1 包 


v Dapkg2 <--------:- com.pkg2 包 
策 _ini_py 回 Enter new package name: 
防 hello.py com pkg 


-一 [eed 
图 4-1 包 层 次 图 4-2 PyCharm 项 目 中 创建 包 


4.6.2” 导 人 包 


包 创 建 好 后 ， 将 两 个 hello 模块 放 到 不 同 的 包 com.pkgl 和 com.pkg2 中 。 由 于 com.pkg1 
的 hello 模块 需要 访问 com.pkg2 的 hello 模块 中 的 元 素 ， 那 么 如 何 导入 呢 ? 事实 上 还 是 通过 
import 语句 ， 需 要 在 模块 前 面 加 上 包 名 。 

重 构 4.5 节 示例 ，com.pkg2 的 hello 模块 代码 : 


# coding=utf-8 
# 代码 文件 : chapter4/4.5/com/pkg2/hello.py 


Y = True 
| 生 自 = 寺 全 


Print(' 进入 com.pkg2.hello 模 块 ') 


com.pkgl 的 hello 模块 代码 : 


# coding=utf-8 
# 代码 文件 : chapter4/4.5/com/pkgl/hello.py 


import com.pkg2.hello as modulel 


@ 日 


from com.pkg2.hello import z 
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y= 20 
print (y) # 访问 当前 模块 变量 Y 

print (modulel.y) # 访问 com.pkg2 .hello 模块 变量 y @ 
print (z) # 访问 com.pkg2 .hello 模块 变量 z 


代码 第 四 行使 用 import 语句 com.pkg2.hello 模块 所 有 代码 元 素 ， 由 于 com.pkg2.hello 模 
块 名 hello 与 当前 模块 名 冲突 ， 因 此 需要 as modulel 语句 为 com.pkg2.hello 模块 提供 一 个 别名 
modulel， 访 问 时 需要 使 用 modulel. 前 级 。 

代码 第 @ 行 是 导入 com.pkg2.hello 模块 中 z 变量 。from com.pkg2.hello import z 语句 也 可 
以 带 有 别名 ， 该 语句 修改 为 如 下 代码 : 


from com.pkg2.hello import z as x 
print (x) # 访问 com.pkg2.hello 模块 变量 z 


使 用 别名 的 目的 是 防止 发 生命 名 冲突 ， 也 就 是 说 要 导入 的 z 名 字 的 变量 在 当前 模块 中 已 经 
存在 了 ， 所 以 给 z 一 个 别名 x。 


本 章 小 结 


本 章 主要 介绍 了 Python 语言 中 最 基本 的 语法 。 首 先 介绍 了 标识 符 和 关键 字 ， 读 者 需要 掌 
握 标识 符 构成 ， 了 解 Python 关键 字 ;， 然后 介绍 了 Python 中 的 变量 、 常 量 、 注 释 和 语句 ， 最 后 
介绍 了 模块 和 包 ， 其 中 要 理解 模块 和 包 的 作用 ， 熟 悉 模块 和 包 导 入 方式 。 


Python 编码 规范 


俗话 说 ;:“ 没 有 规矩 不 成 方圆 。 ”编程 工作 往往 都 是 一 个 团队 协同 进行 ， 因 而 一 致 的 编 
码 规 范 非常 有 必要 ， 这 样 写成 的 代码 便于 团队 中 的 其 他 人 员 阅 读 ， 也 便于 编写 者 自己 以 后 
阅读 。 

关于 本 书 的 Python 编码 规范 借鉴 了 Python 官方 的 PEP8 编码 规范 ?和 谷歌 Python 编码 
规范 2 。 


5.1 命名 规范 


程序 代码 中 到 处 都 是 标识 符 ， 因 此 取 一 个 一 致 并 且 符 合 规范 的 名 字 非 常 重要 。Python 中 命 
名 规范 采用 多 种 不 同方 式 。 不 同 的 代码 元 素 命名 不 同 ， 下 面 将 分 类 说 明 。 
* 包 名 : 全 部 小 写字 母 ， 中 间 可 以 由 点 分 隔 开 ， 不 推荐 使 用 下 画 线 。 作 为 命名 空间 ， 包 名 3 
应 该 具有 唯一 性 ， 推 荐 采用 公司 或 组 织 域名 的 倒置 ， 如 com.apple.quicktime.v2 。 
模块 名 : 全 部 小 写字 母 ， 如 果 是 多 个 单词 构成 ， 可 以 用 下 画 线 隔 开 ， 如 dummy _threading。 
类 名 : 采用 大 驼峰 法 命名 8， 如 SplitViewController。 
异常 名 : 异常 属于 类 ， 命 名 同类 命名 ， 但 应 该 使 用 Error 作为 后 缀 。 如 FileNotFoundError。 
变量 名 : 全 部 小 写字 母 ， 如 果 由 多 个 单词 构成 ， 可 以 用 下 画 线 隔 开 。 如 果 变 量 应 用 于 模 
块 或 函数 内 部 ， 则 变量 名 可 以 由 单 下 画 线 开 头 ， 变量 类 内 部 私有 使 用 变量 名 可 以 双 下 画 
线 开头 。 不 要 命名 双 下 画 线 开头 和 结尾 的 变量 ， 这 是 Python 保留 的 。 另 外 ， 避 免 使 
小 写 L、 大 写 O 和 大 写 工 作为 变量 名 。 
。 函数 名 和 方法 名 : 命名 同 变量 命名 ， 如 balance_account、_push_cm exit。 
“常量 名 : 全 部 大 写字 母 ， 如 果 是 由 多 个 单词 构成 ， 可 以 用 下 画 线 隔 开 ， 如 YEAR 和 
WEEK_ OF MONTH。 


命名 规范 示例 如 下 : 
_saltchars = _string.ascii letters + _string.digits + './' 


def mksalt (method=None): 


@ 参考 地 址 https://www.python.org/dev/peps/pep-0008。 

回 参考 地 址 https://google.github.io/styleguide/pyguide.html。 

轿 ”大 驼峰 法 命名 是 驼峰 命名 的 一 种 ， 驼 峰 命名 是 指 混合 使 用 大 小 写字 母 来 命名 。 驼 峰 命 名 分 为 小 驼峰 法 和 大 驼 
峰 法 。 小 驼峰 法 就 是 第 一 个 单词 全 部 小 写 ， 后 面 的 单词 首 字母 大 写 ， 如 myRoomCount; 大 驼峰 法 是 第 一 个 单词 的 首 
字母 也 大 写 ， 如 ClassRoom。 
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if method is None: 


method = methods[0] 


s = '${}$'.format (method.ident) if method.ident else '' 
s += ''.join( sr.choice( saltchars) for char in range (method.salt chars)) 
return s 

METHOD SHA256 = Method('SHA256', '5', 16, 63) 

METHOD_ SHA512 = Method('SHA512', '6', 16, 106) 

methods = [] 


for method in (METHOD SHAS512, METHOD SHA256, METHOD MD5, METHOD CRYPT): 
_result = crypt('', _method) 
if result and len(_result) == method.total size: 


methods.append(_method) 


5.2 注释 规范 

Python 中 注释 的 语法 有 三 种 : 单行 注释 、 多 行 注释 和 文档 注释 。 本 节 介绍 如 何 规范 使 用 这 
些 注 释 。 

要 码 看 视频 5.2.1 文件 注释 


文件 注释 就 是 在 每 一 个 文件 开头 添加 注释 ， 采 用 多 行 注释 。 文 件 注释 通常 包括 如 下 信息 : 
版 权 信 息 、 文 件 名 、 所 在 模块 、 作 者 信息 、 历 史 版 本 信息 、 文 件 内 容 和 作用 等 。 
下 面 看 一 个 文件 注释 的 示例 : 


# 

# 版 权 所 有 2015 北京 智 捷 东方 科技 有 限 公司 
# 许可 信息 查看 LICENSE .txt 文件 

# 描述 : 

# ”实现 日 期 基本 功能 

# 历史 版 本 : 

# ”2015-7-22: 创建 关东 升 

# 2015-8-2 添加 socket 库 

# ”2015-8-22: 添加 math 库 

# 


上 述 注释 只 是 提供 了 版 权 信息 、 文 件 内 容 和 历史 版 本 信息 等 ， 文 件 注释 要 根据 实际 情况 包 
括 内 容 。 


5.2.2 文档 注释 


文档 注释 就 是 文档 字符 串 ， 注 释 内 容 能 够 生成 API 帮助 文档 ， 可 以 使 用 Python 官方 提供 
的 pydoc 工具 从 Python 源 代码 文件 中 提取 这 些 信息 ， 也 可 以 生成 HTML 文件 。 所 有 公有 的 模 
块 、 函 数 、 类 和 方法 都 应 该 进行 文档 注释 。 

文档 注释 规范 有 些 “ 苛 刻 ”。 文 档 注释 推荐 使 用 一 对 三 重 双 引 号 “ """ ” 包 囊 起 来 ， 注 意 不 
推荐 使 用 三 重 单 引 号 “"”。 文 档 注释 应 该 位 于 被 注释 的 模块 、 函 数 、 类 和 方法 内 部 的 第 一 条 


第 5 章 ”Python 编码 规范 | 这 43 


语句 。 如 果 文 档 注 释 一 行 能 够 注释 完成 ， 结 束 的 三 重 双 引号 也 在 同一 行 。 如 果 文 档 注释 很 长 ， 
第 一 行 注释 之 后 要 留 一 个 空 行 ， 然 后 剩 下 的 注释 内 容 换行 要 与 开始 三 重 双 引 号 对 齐 ， 最 后 结束 
的 三 重 双 引号 要 独占 一 行 ， 并 与 开始 三 重 双 引号 对 齐 。 

下 面 代码 是 Python 官方 提供 的 base64.py 文件 的 一 部 分 。 


#! /usr/bin/env python3 
"Basel6, Base32, Base64 (RFC 3548), Base85 and Ascii85 data encodings""" @ 


# Modified 04-Oct-1995 by Jack Jansen to use binascii module 
# Modified 30-Dec-2003 by Barry Warsaw to add full RFC 3548 support 
# Modified 22-May-2007 by Guido van Rossum to use bytes everywhere 


import re 
import struct 


import binascii 
bytes types = (bytes, bytearray) # Types acceptable as binary data 


def bytes from decode data(s): [(@) 
if isinstance(s, str): 
try: 
return s.encode('ascii') 
except UnicodeEncodeError: 
raise ValueError('string argument should contain only ASCII characters') 
if isinstance(s, bytes types): 
return s 
try: 
return memoryview(s) .tobytes () 
except TypeError: 
raise TypeError("argument should be a bytes-like object or ASCII " 
"string, not %r" % s._ class_._ name ) from None 


# Base64 encoding/decoding uses binascii 


def b64encode (s，altchars=None) : 
"Encode the bytes-like object s using Base64 and return a bytes object. ©@ 


Optional altchars should be a byte string of length 2 which specifies an @ 
alternative alphabet for the '+' and '/' characters. This allows an 
application to e.g. generate url or filesystem safe Base64 strings. 
mm 回 
encoded = binascii.b2a base64(s, newline=False) 
if altchars is not None: 

assert len(altchars) == 2, repr(altchars) 

return encoded.translate (bytes.maketrans (b'+/', altchars)) 


return encoded 
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上 述 代码 第 @ 行 是 只 有 一 行 的 文档 注释 ， 代 码 第 @ 行 ~ 第 @ 行 是 多 行 的 文档 注释 ， 注 意 它 
的 第 一 行 后 面 是 一 个 空 行 ， 代 码 第 @ 行 接着 进行 注释 ， 它 要 与 开始 三 重 双 引 号 对 齐 。 代 码 第 @ 
行 是 结束 三 重 双 引 号 ， 它 独占 一 行 ， 而 且 与 开始 三 重 双 引 号 对 齐 。 另 外 ， 代 码 第 @ 行 定义 的 函 
数 没有 文档 注释 ， 这 是 因为 该 函数 是 模块 私有 的 ， 通 过 它 的 命名 _bytes_from decode data 可 
知 它 是 私有 的 。 


5.2.3 ”代码 注释 


程序 代码 中 处 理 文档 注释 时 还 需要 在 一 些 关键 的 地 方 添加 代码 注释 ， 文 档 注释 一 般 是 给 一 
些 看 不 到 源 代码 的 人 看 的 帮助 文档 ， 而 代码 注释 是 给 阅读 源 代码 的 人 参考 的 。 代 码 注释 一 般 采 
用 单行 注释 和 多 行 注释 。 示 例 代 码 如 下 


# Base32 encoding/decoding must be done in Python (0) 
_b32alphabet = b'ABCDEFGHIJKLMNOPQRSTUVWXY2234567"' 
_b32tab2 = None 


_b32rev = None 


def b32encode (s) : 
"""Encode the bytes-like object s using Base32 and return a bytes object. 
global _b32tab2 
# Delay the initialization of the table to not waste memory @ 
# if the function is never called @ 
if _b32tab2 is None: 
b32tab = [bytes((i,)) for i in b32alphabet] 
_b32tab2 = [a + b for a in b32tab for b in b32tab] 
b32tab = None 


if not isinstance(s, bytes_ types): 
3 = memoryview(s) .tobytes () 
leftover = len(s) % 5 
# Pad the last quantum with zero bits if necessary @ 
if leftover: 
3=53+b'\0' * (5 - leftover) # Don't use += ! 
encoded = bytearray() 
from bytes = int.from bytes 
b32tab2 = _b32tab2 
for i in range(0, len(s), 5): 
c = from bytes(s[i: i + 5], 'big') 
encoded += (b32tab2[c >> 30] + # bits 1 - 10 © 
b32tab2[(c >> 20) & 0x3ff] + # bits 11 - 20 
b32tab2[(c >> 10) & 0x3ff] + # bits 21 - 30 
b32tab2[c & 0x3ff] # bits 31 - 40 
人 
# Rdjust for any leftover partial quanta 
if leftover == 1: 


encoded[-6:] = b'=-----' 


elif leftover == 2: 
encoded[-4:] ==== 

elif leftover == 3: 
encoded[-3:] = b'=== 

elif leftover == 4: 
encoded[-1:] = b'=" 


return bytes (encoded) 
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上 述 代码 第 @ 行 ~ 第 @@ 行 都 是 单行 注释 ， 要 求 与 其 后 的 代码 具有 一 样 的 缩 进 级 别 。 代 码 


第 四 行 ~ 第 图 行 是 多 行 注释 ， 注 释 时 要 求 与 其 


后 的 代码 具有 一 样 的 缩 进 级 别 。 代 码 第 @@ 行 


是 尾 端 进行 注释 ， 这 要 求 注释 内 容 极 短 ， 应 该 再 有 足够 的 空白 至少 两 个 空格 ) 来 分 开 代码 


和 注释 。 
5.2.4 使 用 TODO 注释 


PyCharm 等 IDE 工具 都 为 源 代码 提供 了 一 些 特殊 的 注释 ， 就 是 在 代码 中 加 一 些 标识 ， 便 
于 IDE 工具 快速 定位 代码 ，TODO 注释 就 是 其 中 的 一 种 。TODO 注释 虽然 不 是 Python 官方 所 
提供 的 ， 但 是 主流 的 IDE 工具 也 都 支持 TODO 注释 。 有 TODO 注释 说 明 此 处 有 待 处 理 的 任 


务 ， 或 代码 没有 编写 完成 。 示 例 代码 如 下 : 
import com.pkg2.hello as modulel 
from com.pkg2.hello import z 


Y = 20 


# TODO 声明 函数 
Print (y) 
print (modulel.y) 


# 访问 当前 模块 变量 y 
# 访问 com.pkg2.hello 模块 变量 y 


print (z) # 访问 com.pkg2.hello 模块 变量 z 


这 些 注释 可 以 在 PyCharm 工具 的 TODO 视图 查看 ， 如 果 没 有 打开 TODO 视图 


标 放 到 PyCharm 左下 角 图 按钮 上 ， 弹 出 如 图 5-1 所 示 的 菜单 ， 选 择 TODO， 打 开 如 图 5-2 所 示 


的 TODO 视图 ， 单 击 其 中 的 TODO 可 跳 转 到 注释 处 。 
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图 5-1 打开 TODO 视图 
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图 5-2 查看 TODO 视图 


5.3 ”导入 规范 


导入 语句 总 是 放 在 文件 项 部 ， 位 于 模块 注释 和 文档 注释 之 后 ， 模 块 全 局 变量 和 常量 之 前 。 
每 一 个 导入 语句 只 能 导入 一 个 模块 ， 示 例 代码 如 下 。 
推荐 : 


import re 


import struct 
import binascii 


不 推荐 : 
import re, struct, binascii 


但 是 如 果 from import 后 面 跟 有 多 个 代码 元 素 是 可 以 的 。 


from codeop import CommandCompiler, compile command 


导入 语句 应 该 按照 从 通用 到 特殊 的 顺序 分 组 ， 顺 序 是 : 标准 库 一 第 三 方 库 一 自己 模块 。 每 
一 组 之 间 有 一 个 空 行 ， 而 且 组 中 模块 是 按照 英文 字母 顺序 排序 的 。 


import io [0 
import os 

import pkgutil 

import platform 

import re 

import sys 


import time 
from html import unescape 


from com.pkgl import example 
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上 述 代码 中 导入 语句 分 为 三 组 ， 代 码 第 @ 行 和 第 @ 行 是 标准 库 中 的 模块 ， 注 意 它 的 导入 顺 
序 是 有 序 的 ， 代 码 第 @ 行 是 导入 第 三 方 库 中 的 模块 ， 代 码 第 @ 行 是 导入 自己 的 模块 。 


5.4 代码 排版 


代码 排版 包括 空 行 、 空 格 、 断 行 和 缩 进 等 内 容 。 代 码 排版 内 容 比 较 多 ， 工 作 量 很 大 ， 也 非 
常 重要 。 


5.4.1 空 行 


空 行 用 以 将 逻辑 相关 的 代码 段 分 隔 开 ， 以 提高 可 读 性 。 下 面 是 使 用 空 行 的 规范 。 
(1) import 语句 块 前 后 保留 两 个 空 行 ， 示 例 代 码 如 下 ， 其 中 四 @ 处 和 加 图 处 是 两 个 
空 行 : 
# Copyright 2007 Google, Inc. All Rights Reserved. 
# Licensed to PSF under a Contributor Agreement. 


"""Abstract Base Classes (ABCs) according to PEP 3119.""" 


站 四 日 


rom weakrefset import WeakSet 


(2) 函数 声明 之 前 保留 两 个 空 行 ， 示 例 代 码 如 下 ， 其 中 四 @ 处 是 两 个 空 行 。 


from weakrefset import WeakSet 

O 

@ 

def abstractmethod (funcobj) : 
funcobj._isabstractmethod = True 
return funcobj 


(3) 类 声明 之 前 保留 两 个 空 行 ， 示 例 代 码 如 下 ， 其 中 四 @ 处 是 两 个 空 行 。 


(oO 

加 

class abstractclassmethod (classmethod) : 
_ isabstractmethod = True 


def _init (self, callable): 
callable._isabstractmethod ”= True 


super()._init (callable) 


(4) 方法 声明 之 前 保留 一 个 空 行 ， 示 例 代 码 如 下 ， 其 中 四 处 是 一 个 空 行 。 


class abstractclassmethod(classmethod) : 
_ isabstractmethod = True 
© 
def _init (self, callable): 
callable. isabstractmethod = True 
super()._init (callable) 
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(5) 两 个 逻辑 代码 块 之 间 应 该 保留 一 个 空 行 ， 示 例 代码 如 下 ， 其 中 中 处 是 一 个 空 行 。 


def convert timestamp (val) : 
datepart, timepart = val.split(b" ") 
year, month, day = map(int, datepart.split(b"-")) 
timepart full = timepart.split (b".") 
hours, minutes, seconds = map(int, timepart full[0] .split(b":")) 
if len(timepart full) == 2: 
microseconds = int('{:0<6.6}'.format (timepart full[1] .decode())) 
else: 
microseconds = 0 
@ 
Val = datetime.datetime (year, month, day, hours, minutes, seconds, microseconds) 


return val 


5.4.2 ”空格 


代码 中 的 有 些 位 置 是 需要 有 空格 的 ， 这 个 工作 量 也 很 大 。 下 面 是 使 用 空格 的 规范 。 
(1) 赋值 符号 “=” 前 后 各 有 一 个 空格 。 


a 


10 
c 10 


(2) 所 有 的 二 元 运算 符 都 应 该 使 用 空格 与 操作 数 分 开 。 


(3) 一 元 运算 符 : 算法 运算 符 取 反 “- ”和 运算 符 取 反 “~ ”。 


b 
a 


(4) 括号 内 不 要 有 空格 ，Python 中 括号 包括 小 括号 “() ” 中 括号 “[] ”和 大 括号 “{} ”。 
推荐 : 

doque (cat[1], {dogs: 2}, []) 

不 推荐 : 

doque(cat[ 1 ], { dogs: 2 1, [ ]) 

(5) 不 要 在 逗号 、 分 号 、 冒 号 前 面 有 空格 ， 而 是 要 在 它们 后 面 有 一 个 空格 ， 除 非 该 符号 已 


经 是 行 尾 了 。 
推荐 : 


if x == 88: 


[ee 
1 
oo 


Brint x Y¥ 
Xr Ye 


不 推荐 : 


Af == 88 : 
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print x , y 
xyY=Y，x 


(6) 参数 列表 、 索 引 或 切片 的 左 括号 前 不 应 有 空格 。 
推荐 : 


doque (1) 
dogs['key'] = list[index] 


不 推荐 : 


doque (1) 
dict ['key'] = list [index] 


5.4.3 ” 缩 进 


4 个 空格 常 被 作为 缩 进 排版 的 一 个 级 别 。 虽 然 在 开发 时 程序 员 可 以 使 用 制 表 符 进行 缩 进 ， 
而 默认 情况 下 一 个 制 表 符 等 于 8 个 空格 ， 但 是 不 同 的 IDE 工具 中 一 个 制 表 符 与 空格 对 应 个 数 
会 有 不 同 ， 所 以 不 要 使 用 制 表 符 缩 进 。 

代码 块 的 内 容 相当 于 首 行 缩 进 一 个 级 别 〈4 个 空格 )， 示 例如 下 : 


class abstractclassmethod(classmethod) : 
_ isabstractmethod = True 


def _init_ (self，callable) : 
callable. isabstractmethod = True 
super()._init (callable) 


def _new_(mcls, name, bases, namespace, **kwargs): 
cls = super()._new_ (mcls, name, bases, namespace, **kwargs) 
for base in bases: 


for name in getattr(base, "_ abstractmethods_", set()): 

value = getattr(cls, name, None) 

if getattr(value, "_ isabstractmethod _", False): 
abstracts.add (name) 


cls. abstractmethods ”= frozenset (abstracts) 


return cls 


S.4.4 断 行 


一 行 代码 中 最 多 79 个 字符 ， 对 于 文档 注释 和 多 行 注释 时 一 行 最 多 72 个 字符 ， 但 是 如 果 注 
释 中 包含 URL 地 址 可 以 不 受 这 个 限制 。 否 则 ， 如 果 超 过 则 需 断 行 ， 可 以 依据 下 面 的 一 般 规范 
断 开 。 
(1) 在 逗号 后 面 断 开 。 
bar = long function name (namel, name?, 
name3, name4) 


def long function name(var one, var two, 


var_three, var four): 
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(2) 在 运算 符 前 面 断 开 。 


namel = name2 * (name3 + name4 


- name5) + 4 * name6 


(3) 尽量 不 要 使 用 续 行 符 “\”， 当 有 括号 (包括 大 括号 、 中 括号 和 小 括号 ) 则 在 括号 中 断 
这 样 可 以 不 使 用 续 行 符 。 


def long function name (var one, var_ two, 


六 


Var three, var four): 
return var one + var two + var three \ [0 
+ var_four 


namel = name2 * (name3 + name4 
- name5) + 4 * name6 


bar = long_function name (namel, name2, 
name3, name4) 


foo={ 
long dictionary key: namel + name2 
- name3 + name4 - name5 


} 


c= list[name2 * name3 
+ name4 - name5 + 4 * name6] 


上 述 代 码 第 @ 行 使 用 了 续 行 符 进行 断 行 ， 其 他 的 断 行 都 是 在 括号 中 实现 的 ， 所 以 省 略 了 续 
行 符 。 有 时 为 了 省 略 续 行 符 ， 会 将 表达 式 用 小 括号 括 起 来 ， 如 下 代码 所 示 。 
def long_ function name(var one, var_ two, 
var_ three, var four): 
return (var one + var two + var three 
+ var_four) 


提示 : 在 Python 中 反 斜 杠 “\” 可 以 作为 续 行 符 使 有 用， 告诉 解释 器 当前 行 和 下 一 行 是 连接 
在 一 起 的 。 但 在 大 括号 、 中 括号 和 小 括号 中 续 行 是 隐 式 的 。 


本 章 小 结 


通过 对 本 章 内 容 的 学 习 ， 读 者 可 以 了 解 到 Python 编码 规范 ， 包 括 命名 规范 、 注 释 规 范 、 
导入 规范 和 代码 排版 等 内 容 。 


在 声明 变量 时 会 用 到 数据 类 型 ， 前 面 已 经 用 到 过 一 些 数据 类 型 ， 例 如 整数 和 字符 串 等 。 在 
Python 中 所 有 的 数据 类 型 都 是 类 ， 每 一 个 变量 都 是 类 的 “实例 ”。 没 有 基本 数据 类 型 的 概念 ， 
所 以 整数 、 浮 点 和 字符 串 也 都 是 类 。 

Python 有 6 种 标准 数据 类 型 : 数字 、 字 符 串 、 列 表 、 元 组 、 集 合 和 字典 ， 而 列表 、 元 组 、 
集合 和 字典 可 以 保存 多 项 数据 ， 它 们 每 一 个 都 是 一 种 数据 结构 ， 本 书 中 把 它们 统称 为 “数据 结 
构 ” 类 型 。 

本 章 先 介绍 数字 和 字符 串 ， 列 表 、 元 组 、 集 合 和 字典 数据 类 型 会 在 后 面 章节 详细 介绍 。 


6.1 数字 类 型 


Python 数字 类 型 有 4 种 : 整数 类 型 、 浮 点 类 型 、 复 数 类 型 和 布尔 类 型 。 需 要 注意 的 是 ， 布 加 
尔 类 型 也 是 数字 类 型 ， 它 事实 上 是 整数 类 型 的 一 种 。 


@ 
6.1.1 整数 类 型 扫 码 看 视频 


Python 整数 类 型 为 mt， 整数 类 型 的 范围 可 以 很 大 ， 可 以 表示 很 大 的 整数 ， 这 只 受 所 在 计 
算 机 硬件 的 限制 。 


提示 : Python 3 不 再 区 分 整数 和 长 整数 ， 所 有 需要 的 整数 都 可 以 是 长 整数 。 


默认 情况 下 一 个 整数 值 表 示 十 进 制 数 ， 例 如 16 表示 的 十 进 制 整数 。 其 他 进 制 ， 如 二 进 制 
数 、 八 进 制 数 和 十 六 进 制 整数 表示 方式 如 下 : 

。 二进制 数 : 以 0b 或 0B 为 前 缀 ， 注 意 0 是 阿拉 伯 数 字 ， 不 要 误 认为 是 英文 字母 o。 

。 八进制 数 : 以 0o 或 00 为 前 缀 ， 第 一 个 字符 是 阿拉 伯 数 字 0， 第 二 个 字符 是 英文 字母 o 或 0。 

* 十 六 进 制 数 : 以 0x 或 0X 为 前 级 ， 注 意 0 是 阿拉 伯 数 字 。 

例如 整数 值 28、0b11100、0B11100、0034、0034、0x1C 和 0X1C 都 表示 同一 个 数字 。 在 
Python Shell 输出 结果 如 下 : 

>>> 28 

28 

>>> 0b1l1100 

28 

>>> 0034 

28 
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>>> 0o34 
28 
>>> 0x1C 
28 
>>> 0X1C 
28 


6.1.2” 浮 点 类 型 


浮 点 类 型 主要 用 来 储存 小 数 数值 , Python 浮 点 类 型 为 float, Python 只 支持 双 精 度 浮 点 类 型 ， 
而 且 与 本 机 相关 。 

浮 点 类 型 可 以 使 用 小 数 表 示 ， 也 可 以 使 用 科学 计数 法 表示 ， 科 学 计数 法 中 会 使 用 大 写 或 小 
写 的 e 表 示 10 的 指数 ， 如 e2 表示 10”。 

在 Python Shell 中 运行 示例 如 下 : 


>>> 0.0 


>>> 3.36e2 
336.0 
>>> 1.56e-2 
0.0156 


其 中 3.36e2 表示 的 是 3.36X10”，1.56e-2 表示 的 是 1.56 X10”。 


6.1.3 ”复数 类 型 


复数 在 数学 中 是 非常 重要 的 概念 ， 无 论 是 在 理论 物理 学 ， 还 是 在 电气 工程 实践 中 都 经 常 使 
用 。 但 是 很 多 计算 机 语言 都 不 支持 复数 ， 而 Python 是 支持 复数 的 ， 这 使 得 Python 能 够 很 好 地 
用 来 进行 科学 计算 。 

Python 中 复数 类 型 为 complex， 例 如 1+2j 表 示 的 是 实 部 为 1、 虚 部 为 2 的 复数 。 在 
Python Shell 中 运行 示例 如 下 : 

>>> 142j 

(1+2j) 

>93. (E29 + (1123) 

(2+4j) 


上 述 代 码 实现 了 两 个 复数 (1+2j) 的 相 加 。 


6.1.4 ”布尔 类 型 
Python 中 布尔 类 型 为 bool，bool 是 int 的 子 类 ， 它 只 有 两 个 值 : True 和 False。 


注意 : 任何 类 型 数据 都 可 以 通过 bool() 函数 转换 为 布尔 值 ， 那 些 被 认为 “没有 的 ”“ 空 的 ” 
值 会 转换 为 False， 反 之 转换 为 True。 如 None ( 空 对 象 )、False、0、0.0、0j (复数 )、" ( 空 字 
符 串 )、[]( 空 列表 )、0 〇 ( 空 元 组 ) 和 {} ( 空 字典 ) 这 些 数值 会 转换 为 False， 否 则 是 True。 
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示例 如 下 : 


>>> bool(0) 
False 

>>> bool1(2) 
True 

>>> bool1(1) 
True 

>>> bool('') 
False 

>>> bool(' 小 
True 

>>> bool([]) 
False 

>>> bool({}) 
False 


上 述 代 码 中 bool(2) 和 bool(1) 表达 式 输出 的 True， 这 说 明 2 和 1 都 能 转换 为 True， 在 整 
数 中 只 有 0 是 转换 为 False 的 ， 其 他 类 型 亦 是 如 此 。 


6.2 数字 类 型 相互 转换 


学 习 了 前 面 的 数据 类 型 后 ， 大 家 会 思考 一 个 问题 ， 数 据 类 型 之 间 是 否 可 以 转换 呢 ? Python 国 六 
通过 一 些 函 数 可 以 实现 不 同 数据 类 型 之 间 的 转换 ， 如 数字 类 型 之 间 互相 转换 以 及 整数 与 字符 串 
之 间 的 转换 。 本 节 先 讨论 数字 类 型 的 互相 转换 。 say 

除 复数 外 ， 其 他 的 三 种 数字 类 型 整数 、 浮 点 和 布尔 ) 都 可 以 互相 进行 转换 ， 转 换 分 为 隐 
式 类 型 转换 和 显 式 类 型 转换 。 


6.2.1 隐 式 类 型 转换 


多 个 数字 类 型 数据 之 间 可 以 进行 数学 计算 ， 由 于 参与 进行 计算 的 数字 类 型 可 能 不 同 ， 此 时 
会 发 生 隐 式 类 型 转换 。 计 算 过 程 中 隐 式 类 型 转换 规则 如 表 6-1 所 示 。 


表 6-1 隐 式 类 型 转换 规则 


操作 数 1 类 型 操作 数 2 类 型 转换 后 的 类 型 
布尔 整数 整数 
布尔 、 整数 浊 点 


布尔 数值 可 以 隐 式 转换 为 整数 类 型 ， 布 尔 值 True 转换 为 整数 1， 布 尔 值 False 转换 为 整数 
0。 在 Python Shell 中 运行 示例 如 下 : 


>>> a = 1 + True 

>>> print (a) 

多 

>>>a=1.0+1 

>>> type (a) @ 
<class 'float'> 


>>> print (a) 
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2.0 
>>> a=1.0 + True 

>>> print (a) 

2.0 

>>> a= 1.0+ 1 +False 
>>> print (a) 

2.0 


从 上 述 代码 表达 式 的 运算 结果 类 型 可 知 表 6-1 所 示 的 类 型 转换 规则 ， 这 里 不 再 资 述 。 另 
外 ， 上 述 代码 第 四 行使 用 了 type() 函数 , type() 函数 可 以 返回 传 入 数据 的 类 型 ，<class 'float> 
说 明 是 浮 点 类 型 。 


6.2.2” 显 式 类 型 转换 


在 不 能 进行 隐 式 转换 情况 下 ， 就 可 以 使 用 转换 函数 进行 显 式 转换 了 。 除 复数 外 ， 三 种 数字 
类 型 (整数 、 浮 点 和 布尔 ) 都 有 自己 的 转换 函数 ， 分 别 是 int()、float() 和 bool(0 函数 ，bool0 
函数 在 6.1.4 节 已 经 介绍 过 了 ， 这 里 不 再 效 述 。 

int() 函数 可 以 将 布尔 、 浮 点 和 字符 串 转 换 为 整数 。 布 尔 数值 True 使 用 intO 函数 返回 1， 
False 使 用 int() 函数 返回 0 ; 浮 点 数值 使 用 int() 函数 会 截 掉 小 数 部 分 。int() 函数 转换 字符 
串 会 在 6.3 节 再 介绍 。 

float() 函数 可 以 将 布尔 、 整 数 和 字符 串 转 换 为 浮 点 。 布 尔 数 值 True 使 用 float( 函数 返回 
1.0，False 使 用 float() 函数 返回 0.0 ; 整数 值 使 用 float() 函数 会 加 上 小 数 部 分 “.0”。float() 函 
数 转换 字符 串 会 在 6.3 节 再 介绍 。 

在 Python Shell 中 运行 示例 如 下 : 

>>> int (False) 

0 

>>> int (True) 

1 

>>> int(19.6) 

19 

>>> float (5) 

SO 

>>> float (False) 

0.0 

>>> float (True) 

1.0 


6.3 字符 串 类 型 


由 字符 组 成 的 一 品 字 符 序列 称 为 “字符 串 ”， 字 符 串 是 有 顺序 的 ， 从 左 到 右 ， 索 引 从 0 开 
始 依次 递增 。Python 中 字符 串 类 型 是 str。 

回 

#3。 6.3.1 字符 串 表示 方式 

Python 中 字符 串 的 表示 方式 有 如 下 三 种 。 
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“普通 字符 串 : 采用 单 引 号 “'” 或 双 引 号 “"” 包 于 起 来 的 字符 串 。 

。 原 始 字 符 串 (raw string) : 在 普通 字符 串 前 加 r， 字 符 串 中 的 特殊 字符 不 需要 转 义 ， 按 照 
字符 串 的 本 来 “面目 ”呈现 。 

。 长 字符 串 : 字符 串 中 包含 了 换行 缩 进 等 排版 字符 ， 可 以 使 用 三 重 单 引号 “"" ”或 三 重 双 
引号 “""" ”包裹 起 来 ， 这 就 是 长 字符 串 。 

1) 普通 字符 串 

很 多 程序 员 习 惯 使 用 单 引号 “' ”表示 字符 串 。 下 面 示 例 表 示 的 都 是 Hello World 字符 串 。 

"Hello World'" 

"Hello World" 

'\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064' ©@ 

"\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064" @ 


Python 中 的 字符 采用 Unicode 编码 ， 所 以 字符 串 可 以 包含 中 文 等 亚洲 字符 。 代 码 第 @ 行 
和 第 @ 行 的 字符 串 是 用 Unicode 编码 表示 的 字符 串 ， 事 实 上 它 表 示 的 也 是 Hello World 字符 串 ， 
可 通过 print 函数 将 Unicode 编码 表示 的 字符 串 输出 到 控制 台 ， 则 会 看 到 Hello World 字符 串 。 
在 Python Shell 中 运行 示例 如 下 : 


>>> s = 'Hello World' 

>>> print(s) 

Hello World 

>>> s = "Hello World" 

>>> print(s) 

Hello World 

>>> s = "\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064" 
>>> print(s) 

Hello World 

>>> s = "\u0048\u0065\u006c\u006c\u006f\u0020\u0057\u006f\u0072\u006c\u0064" 
>>> print(s) 

Hello World 


如 果 想 在 字符 串 中 包含 一 些 特殊 的 字符 ， 例 如 换行 符 、 制 表 符 等 ， 在 普通 字符 串 中 则 需要 
转 义 ， 前 面 要 加 上 反 斜 本 “\”， 这 称 为 字符 转 义 。 表 6-2 所 示 是 常用 的 几 个 转 义 符 。 


表 6-2 转 义 符 
字符 表示 Unicode 编码 说 明 
At \u0009 水 平 制 表 符 
un \u000a 换行 
¥ \u000d 回 车 


Ww \u0022 双 引 号 
Y \u0027 单 引号 


a 


在 Python Shell 中 运行 示例 如 下 : 


>>> 3 = "Hello\n World'" 


>>> print (s) 
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Hello 

World 

>>> s = "HelloNt World' 

>>> print(s) 

Hello World 

>>> s = "Hello\' World' 

>>> Print(s) 

Hello' World 

>>> 3 = "Hello' World" @ 
>>> print(s) 

Hello' World 

>>> s = 'Hello" World' 加 
>>> print(s) 

Hello" World 

>>> s = 'Hello\\ World' @ 
>>> print(s) 

Hello\ World 

>>> s = "HelloNvu005c World' ® 
>>> print(s) 

Hello\ World 


字符 串 中 的 单 引 号 “'” 和 双 引 号 “"” 也 可 以 不 用 转 义 符 。 在 包含 单 引号 的 字符 串 中 使 用 双 
引号 包 囊 字 符 串 ， 见 代码 第 @ 行 ， 在 包含 双 引号 的 字符 串 中 使 用 单 引 号 包 庄 字符 串 ， 见 代码 第 @ 
行 。 另 外 ， 可 以 使 用 Unicode 编码 替代 需要 转 义 的 特殊 字符 ， 代 码 第 @@ 行 与 代码 第 @ 行 是 等 价 的 。 

2) 原始 字符 串 Gaw string) 

在 普通 字符 串 前 面 加 字母 r， 表 示 字 符 串 是 原始 字符 串 。 原 始 字符 串 可 以 直接 按照 字符 串 
的 字面 意思 来 使 用 ， 没 有 转 义 字符 。 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> s = 'Hello\tWorld' [0) 
>>> print(s) 
Hello World 
>>> s = r'Hello\tWorld’ 加 
>>> print(s) 
Hello\tWorld 


代码 第 中 行 是 普通 字符 串 ， 代 码 第 加 行 是 原始 字符 串 ， 它 们 的 区 别 只 是 在 字符 串 前 面 加 字 
母 7。 从 输出 结果 可 见 ， 原 始 字符 串 中 的 \t 没有 被 当成 制 表 符 使 用 。 


3) 长 字符 串 

字符 串 中 包含 了 换行 缩 进 等 排版 字符 时 ， 则 可 以 使 用 长 字符 串 。 在 Python Shell 中 运行 示 
例 代码 如 下 : 

>>> s ="'''Hello 

World'"'" 


>>> print(s) 
Hello 
World 
>>> s = """ Hello \t (0) 


World""" 
>>> print(s) 
Hello 
World 


长 字符 串 中 如 果 包含 特殊 字符 也 需要 转 义 ， 见 代码 第 @ 行 。 
6.3.2 ”字符 串 格式 化 
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在 实际 的 编程 过 程 中 ， 经 常会 遇 到 将 其 他 类 型 变量 与 字符 串 拼 接 到 一 起 并 进行 格式 化 输出 
的 情况 。 例 如 计算 的 金额 需要 保留 小 数 点 后 四 位 ， 数 字 需 要 右 对 齐 等 ， 这 些 都 需要 格式 化 。 
在 字符 串 格式 化 时 可 以 使 用 字符 串 的 format() 方法 以 及 占 位 符 。 在 Python Shell 中 运行 示 


例如 下 : 


>>> name = "Mary'" 

>>> age = 18 

>>> s = ' 她 的 年 龄 是 {0} 岁 。 
>>> print(s) 

她 的 年 龄 是 18 岁 。 

>>> s = '{0) 芳 龄 是 {11 岁 。 
>>> print(s) 

Mary 芳 龄 是 18 岁 。 

>>> s = '{1)} 芳 龄 是 {0) 岁 。 
>>> print(s) 

Mary 芳 龄 是 18 岁 。 

>>> s = '{fnl 芳 龄 是 {al 岁 。 
>>> print(s) 

Mary 芳 龄 是 18 岁 。 


.format (age) @O 


.format (name, age) @ 


.format (age, name) @ 


.format (n=name, a=age) 四 


字符 串 中 可 以 有 占 位 符 ({} 表示 的 内 容 )， 配 合 format0 方法 使 用 ， 会 将 format( 方法 中 
的 参数 蔡 换 占 位 符 内 容 。 占 位 符 可 以 用 参数 索引 表示 ， 见 代码 第 @ 行 、 第 @ 行 和 第 @ 行 ， 也 可 


以 使 用 参数 的 名 字 表 示 占 位 符 ， 见 代码 第 @ 行 ，n 和 a 都 是 参数 名 字 。 


占 位 符 中 还 可 以 有 格式 化 控制 符 ， 对 字符 串 的 格式 进行 更 加 精准 控制 。 不 同 的 数据 类 型 在 


进行 格式 化 时 需要 不 同 的 控制 符 ， 这 些 格式 化 控制 符 如 表 6-3 所 示 。 


表 6-3 字符 串 格式 化 控制 符 


控制 符 说 明 

s 字符 串 格式 化 

d 十 进 制 整数 

人 了 十 进 制 浮 点 数 

g、G 十 进 制 整数 或 浮 点数 

e\E 科学 计算 法 表示 浮 点 数 

o 八进制 整数 ， 符 号 是 小 写 英文 字母 o 

% 十 六 进 制 整数 ，x 是 小 写 表 示 ，X 是 大 写 表示 


格式 控制 符 位 于 占 位 符 索引 或 占 位 符 名 字 的 后 面 ， 之 间 用 冒号 分 隔 ， 例 如 {1:d} 表示 索引 
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为 1 的 占 位 符 格式 参数 是 十 进 制 整数 。 在 Python Shell 中 运行 示例 如 下 : 
>>> name = "Mary' 
>>> age = 18 
>>> money = 1234.5678 


>>> "1{01 芳 龄 是 (1:dl 岁 。" .format (name，age) O 
"Mary 芳 龄 是 18 岁 。" 

>>> "{11 芳 龄 是 [0:5d} 岁 。" .format (age, name) @ 
"Mary 芳 龄 是 18 岁 。" 

>>> "{0]} 今天 收入 是 {1:f] 元 。" .format (name，money) @ 
'Mary 今天 收入 是 1234.567800 元 。' 

>>> "{0} 今天 收入 是 {1: .2f} 元 。". format (name, money) @ 
"Mary 今天 收入 是 1234.57 元。' 

>>> "{0} 今天 收入 是 {1:10.2f} 元 。".format (name, money) © 


"Mary 今天 收入 是 1234.57 元 。' 

>>> "{0} 今天 收入 是 {1:9} 元 。" .format (name, money) 
"Mary 今天 收入 是 1234.57 元 。' 

>>> "{0} 今天 收入 是 {1:6G} 元 。" .format (name, money) 
"Mary 今天 收入 是 1234.57 元。' 

>>> "{0} 今天 收入 是 {1:e} 元 。".format (name, money) 
"Mary 今天 收入 是 1.234568e+03 元 。' 

>>> "{0} 今天 收入 是 {1:E} 元 。" .format (name, money) 
"'Mary 今天 收入 是 1.234568E+03 元 。' 

>>> ' 十 进 制 数 {0: dl 的 八进制 表示 为 {0:o}， 十 六 进 制 表示 为 {0:x}"' .format (28) 
' 十 进 制 数 28 的 八进制 表示 为 34， 十 六 进 制 表示 为 1c' 


上 述 代码 第 四 行 中 {1:d} 是 格式 化 十 进 制 整数 ， 代 码 第 @ 行 中 {0:5d} 是 指定 输出 长 度 为 
5 的 字符 串 ， 不 足 用 空格 补 齐 。 代 码 第 @ 行 中 {1:d} 是 格式 化 十 进 制 浮 点 数 ， 从 输出 的 结果 可 
见 ， 小 数 部 分 太 长 了 。 如 果 想 控制 小 数 部 分 可 以 使 用 代码 第 @ 行 的 {1:.2f} 占 位 符 ， 其 中 表示 
保留 小 数 两 位 四舍五入 ) 。 如 果 想 设置 长 度 可 以 使 用 代码 第 @ 行 的 {1:10.2f} 占 位 符 ， 其 中 10 
表示 总 长 度 ， 包 括 小 数 点 和 小 数 部 分 ， 不 足 用 空格 补 位 。 


6.3.3 ”字符 串 查 找 


在 给 定 的 字符 串 中 查找 子 字符 串 是 比较 常见 的 操作 。 字 符 串 类 (str) 中 提供 了 find 和 tfind 
方法 用 于 查找 子 字符 串 ， 返 回 值 是 查找 到 的 子 字 符 串 所 在 的 位 置 ， 没 有 找到 返回 -1。 下 面 只 
具体 说 明 find 和 rfind 方法 。 

。 str.find(sub[, start[, end]]) : 在 索引 start 到 end 之 间 查 找 子 字符 串 sub， 如 果 找 到 返回 最 

左 端 位 置 的 索引 ， 如 果 没 有 找到 返回 -1。start 是 开始 索引 ，end 是 结束 索引 ， 这 两 个 参 
数 都 可 以 省 略 ， 如 果 start 省 略 说 明 查 找 从 字符 串 头 开始 ; 如 果 end 省 略 说 明 查 找到 字符 
串 尾 结束 ;如 果 全 部 省 略 就 是 查找 全 部 字符 串 。 

。str.rfind(sub[, start[, end]]) : 与 find 方法 类 似 ， 区 别 是 如 果 找 到 返回 最 右 端 位 置 的 

索引 。 如 果 在 查找 的 范围 内 只 找到 一 处 子 字符 串 ， 那 么 这 里 find 和 rfind 方法 返回 值 
相同 。 
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提示 : 在 Python 文档 中 [表示 可 以 省 略 部 分 ，find 和 Trfind 方法 参数 [, start[, end]] 表示 
start 和 end 都 可 以 省 略 。 


在 Python Shell 中 运行 示例 代码 如 下 : 


>>> source_ str = "There is a string accessing example." 


>>> len(source str) (0) 

>>> source str[16] 加 

>>> source str.find('r') 

>>> source_ str.rfind('r') 

>>> source_ str.find('ing') 

>>> source str.rfind('ing') 

>>> source str.find('e', 15) 

>>> source_str.rfind('e', 15) 

>>> source str.find('ing', 5) 

>>> source str.rfind('ing', 5) 

>>> source str.find('ing', 18, 28) 

>>> source str.rfind('ingg', 5) 

上 述 代码 第 @ 行 len(source_str) 返回 字符 串 长 度 ， 注 意 len 是 函数 ， 不 是 字符 串 的 一 个 方 
它 的 参数 是 字符 串 。 代 码 第 @ 行 source_str[16] 访问 字符 串 中 索引 16 的 字符 。 

上 述 字 符 串 查找 方法 比较 类 似 ， 这 里 重点 解释 一 下 source_str.find('ing', 5) 和 source_str. 


rfind('ing', 5) 表达 式 。 从 图 6-1 可 见 ，ing 字符 串 出 现 过 两 次 ， 索 引 分 别 是 14 和 24。source_ 
strfnd(ing', 5) 返回 最 左 端 索 引 14， 返 回 值 为 14; source_str.rfind('ing', 5) 返回 最 右 端 索引 24。 


法 


012345 6 7 8 9 10111213 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 
Tihlelrle ils a sitilrliln alclclelslsli|n elxlalm llel. 


图 6-1 source_str 字符 串 索 引 
提示 : 函数 与 方法 的 区 别 是 ， 方 法 是 定义 在 类 中 的 函数 ， 在 类 的 外 部 调用 时 需要 通过 类 或 
对 象 调用 ,例如 上 述 代 码 Source _strfind('r") 就 是 调用 字符 串 对 象 source_str 的 find 方法 ，find 
方法 是 在 str 类 中 定义 的 。 而 通常 的 函数 不 是 类 中 定义 的 ， 也 称 为 顶层 函数 ， 它 们 不 属于 任何 
一 个 类 ， 调 用 时 直接 使 用 函数 即 可 ， 例 如 上 述 代码 中 的 len(source_ str)， 就 调用 了 len 函数 ， 
只 不 过 它 的 参数 是 字符 串 对 象 source_str。 
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6.3.4 字符 串 与 数字 相互 转换 


在 实际 的 编程 过 程 中 ， 经 常会 用 到 字符 串 与 数字 相互 转换 。 下 面 从 两 个 不 同 的 方面 介绍 字 
符 串 与 数字 相互 转换 。 

1) 字符 串 转 换 为 数字 

字符 串 转 换 为 数字 可 以 使 用 intO 和 float0 函数 实现 ，6.2.2 节 介 绍 了 这 两 个 函数 实现 数字 
类 型 之 间 的 转换 ， 事 实 上 这 两 个 函数 也 可 以 接收 字符 串 参 数 ， 如 果 字 符 串 能 成 功 转换 为 数字 ， 
则 返回 数字 ， 否 则 引发 异常 。 

在 Python Shell 中 运行 示例 代码 如 下 : 


Sy ntt"9") 
9 
>>> int('9.6') 
Traceback (most recent call last): 
File "<pyshell#2>", line 1, in <module> 
int('9.6') 
ValueError: invalid literal for int() with base 10: '9.6' 
>>> float ('9.6') 
9.6 
>>> int('AB') 
Traceback (most recent call last): 
File "<pyshell#4>", line 1, in <module> 
int('AB') 
ValueError: invalid literal for int() with base 10: 'AB' 
>>> 


默认 情况 下 int0 函数 都 将 字符 串 参 数 当 成 十 进 制 数 字 进 行 转换 ， 所 以 int(AB') 会 失败 。 
int() 函数 也 可 以 指定 基数 〈 进 制 )， 在 Python Shell 中 运行 示例 如 下 : 


>>> int('AB', 16) 
171 


2) 数字 转换 为 字符 串 

数字 转换 为 字符 串 有 很 多 种 方法 ，6.3.2 节 介绍 的 字符 串 格式 化 可 以 实现 将 数字 转换 为 字 
符 串 。 另 外 ，Python 中 字符 串 提 供 了 str0 函数 。 

可 以 使 用 str0 函数 将 任何 类 型 的 数字 转换 为 字符 串 。 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> str(3.24) 
"3.24' 

>>> str(True) 
"True' 

>>> str([]) 

1 

>>> str([1,2,3]) 
"[1, 2, 3]" 

>>> str (34) 

134， 
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从 上 述 代码 可 知 str0 函数 很 强大 ， 什 么 类 型 都 可 以 转换 。 但 缺点 是 不 能 格式 化 ， 如 果 格 
式 化 字符 串 需要 使 用 format 函数 。 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> '{0:.2f£}'.format (3.24) 


'3.24" 
>>> '{:.1f}'.format (3.24) 

13.2! 

>>> '{:10.1f}'.format (3.24) 


352” 


提示 : 在 格式 化 字符 串 时 ， 如 果 只 有 一 个 参数 ， 占 位 符 索引 可 以 省 略 。 


本 章 小 结 


本 章 主 要 介绍 了 Python 中 的 数据 类 型 ， 读 者 需要 重点 掌握 数字 类 型 与 字符 串 类 型 ， 熟 悉 
数字 类 型 的 互相 转换 ， 以 及 数字 类 型 与 字符 串 之 间 的 转换 。 


运 算 符 


本 章 为 大 家 介绍 Python 语言 中 一 些 主要 的 运算 符 (也 称 操作 符 )， 包 括 算术 运算 符 、 关 系 
运算 符 、 逻 辑 运算 符 、 位 运算 符 和 其 他 运算 符 。 


7.1 算术 运算 符 


Python 中 的 算术 运算 符 用 来 组 织 整 型 和 浮 点 型 数据 的 算术 运算 ， 按 照 参加 运算 的 操作 数 的 
不 同 可 以 分 为 一 元 运算 符 和 二 元 运算 符 。 
回 


要 码 看 视频 7.1.1 一 元 运算 符 


Python 中 一 元 运算 符 有 多 个 ， 但 是 算数 一 元 运算 符 只 有 一 个 ， 即 -，- 是 取 反 运算 符 ， 例 
如 : -a 是 对 a 取 反 运算 。 

在 Python Shell 中 运行 示例 代码 如 下 

>>> a = 12 

>>> -a 

-12 

>>> 


上 述 代码 是 把 a 变量 取 反 ， 结 果 输 出 是 -12。 
7.1.2 ”二 元 运算 符 


二 元 运算 符 包括 +、-、*、/、%、** 和 //， 这 些 运 算 符 主要 是 对 数字 类 型 数据 进行 操作 ， 
而 + 和 * 可 以 用 于 字符 串 、 元 组 和 列表 等 类 型 的 数据 操作 ， 有 具体 说 明 参 见 表 7-1。 


表 7-1 二 元 算术 运算 符 


可 用 于 数字 、 序 列 等 类 型 数据 操作 
对 于 数字 类 型 是 求 和 ; 其 他 类 型 是 连接 操作 


加 减 求 a 减 b 的 差 a-b 
可 用 于 数字 、 序 列 等 类 型 数据 操作 

对 于 数字 类 型 是 求 积 ; 其 他 类 型 是 重复 操作 
除 求 a 除 以 b 的 商 alb 
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续 表 
运 说 明 例 子 
求 a 除 以 b 的 余数 a%b 

求 a 的 b 次 宕 a*#b 

求 小 于 a 除 以 b 商 的 最 大 整数 allb 


在 Python Shell 中 运行 示例 代码 如 下 : 


>>>1+2 


V 
v 
v 
D 

+ 
w 


vy 
MA 
v 
加 
口 

4 

+4 
Db 


100 

>>> 10.22 + 10 
20.22 

>>> 10.0 + True + 2 
13.0 


上 述 例 子 中 分 别 对 数字 类 型 数据 进行 了 二 元 运算 ， 其 中 True 被 当 作 整数 1 参与 运算 ， 操 
作 数 中 有 浮 点 数字 ， 表 达 式 计算 结果 也 是 浮 点 类 型 。 其 他 代码 比较 简单 ， 不 再 装 述 。 

字符 串 属于 序列 的 一 种 ， 所 以 字符 串 可 以 使 用 “+” 和 “*” 运 算 符 ， 在 Python Shell 中 
运行 示例 代码 如 下 : 


>>> "Hello' + 'World’' 
"HelloWorld' 
>>> "Hello' + 2 
Traceback (most recent call last): 
File "<pyshell#35>", line 1, in <module> 
"Hello” 4:2 
TypeError: must be str, not int 
>>> 
3 ellor 过 
'HelloHello" 
S33 Mellor 2 
Traceback (most recent call last): 
File "<pyshell#36>", line 1, in <module> 
"Hello 二 之 和 
TypeError: can't multiply sequence by non-int of type 'float’ 


“+” 运 算 符 会 将 两 个 字符 串 连接 起 来 ， 但 不 能 将 字符 串 与 其 他 类 型 数据 连接 起 来 。“*” 
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运算 符 第 一 操作 数 是 字符 串 ， 第 二 操作 数 是 整数 ， 表 示 重 复 字 符 串 多 次 。 因 此 'Hello' * 2 结果 
是 'HelloHello'， 注 意 第 二 操作 数 只 能 是 整数 。 
7.2 关系 运算 符 


关系 运算 是 比较 两 个 表达 式 大 小 关系 的 运算 ， 它 的 结果 是 布尔 类 型 数据 ， 即 True 或 
False。 关 系 运算 符 有 6 种: ==、!=、>、<、>= 和 <=， 具 体 说 明 参 见 表 7-2。 


表 7-2 关系 运算 符 


说 明 
a 等 于 b 时 返回 True， 否 则 返回 False 
与 一 相反 
a 大 于 b 时 返回 True， 否 则 返回 False 
a 小 于 b 时 返回 True， 否 则 返回 False 
a 大 于 或 等 于 b 时 返回 True， 否 则 返回 False 
a 小 于 或 等 于 b 时 返回 True， 否 则 返回 False 


>>>a=1 
>>>b=2 
>>> a > b 
False 
>>>a<b 
True 


>>> a >= b 
False 
>a<=B 


True 
35> 0 == 1 
True 
32>> 1.0 1= 1 
False 


Python 中 关系 运算 可 用 于 比较 序列 或 数字 ， 整 数 、 浮 点 数 都 是 对 象 ， 可 以 使 用 关系 运算 符 
进行 比较 ;字符 串 、 列 表 和 元 组 属于 序列 也 可 以 使 用 关系 运算 符 进行 比较 。 在 Python Shell 中 


运行 示例 代码 如 下 : 

>>> a = 'Hello' 
>>> b = 'Hello' 
>>> a == b 
True 

>>> a = 'World' 
>>> aa > b 

True 

>>> a < b 
False 


>>> a = [fl (0 
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>>> b = [1, 2] 加 
>>> a == b 

False 

>>> a < b 

True 

>>> a = [1, 2] 

>>> a == b 

True 


代码 第 @ 行 创建 一 个 空 列表 ， 代 码 第 @ 行 创建 一 个 两 个 元 素 的 列表 ， 它 们 也 可 以 进行 比较 。 
7.3 ”逻辑 运算 符 
逻辑 运算 符 对 布尔 型 变量 进行 运算 ， 其 结果 也 是 布尔 型 ， 具 体 说 明 参 见 表 7-3。 


表 7-3 逻辑 运算 符 


a 为 True 时 ， 值 为 False，a 为 False 时 ， 值 为 True 


a、b 全 为 True 时 ,计算 结果 为 True， 和 否则 为 False 
a、b 全 为 False 时 ,计算 结果 为 False， 否 则 为 True 


Python 中 的 “逻辑 与 ”和 “人 逻辑 或 ”都 采用 “短路 ”设计 ， 例 如 a and b， 如 果 a 为 
False， 则 不 计算 b (因为 不 论 b 为 何 值 ,“ 与 ”操作 的 结果 都 为 False) ; 而 对 于 a or b， 如 果 a 
为 True， 则 不 计算 b (因为 不 论 b 为 何 值 ,“ 或 ”操作 的 结果 都 为 True) 。 

这 种 短路 形式 的 设计 ， 使 它们 在 计算 过 程 中 就 像 电路 短路 一 样 采 用 最 优化 的 计算 方式 ， 从 
而 提高 效率 。 示 例 代 码 如 下 : 


# 代码 文件 ，chapter7/7.3/hello.py 
0 


10 
9 


时 
a 
b 


i .aE 主 二 = 下 5 
Print (" 或 运算 为 真 ") 
else: 


print ("或 运算 为 假 ") 


if a<bandi = 1: 
print (" 与 运算 为 真 ") 
else: 


print (" 与 运算 为 假 ") 


def fl() : OO 


Feturn a > b 
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def f2() : @ 
print("--E2--") 


return a == b 


print (f1() or f2()) @ 


输出 结果 如 下 : 


或 运算 为 真 
与 运算 为 假 


True 

上 述 代码 第 @ 行 和 第 加 行 定义 的 两 个 函数 返回 的 是 布尔 值 。 代 码 第 @ 行 进行 “或 ”运算 ， 
由 于 短路 计算 ，f1 函数 返回 True 之 后 ， 不 再 调用 亿 函数 。 
7.4 位 运算 符 


位 运算 是 以 二 进位 (bit) 为 单位 进行 运算 的 ， 操 作 数 和 结果 都 是 整 型 数据 。 位 运算 符 有 如 
下 几 个 运算 符 : &、|、^、~、>> 和 <<， 具 体 说 明 参 见 表 7-4。 


表 7-4 位 运算 符 


说 明 
将 x 的 值 按 位 取 反 
x 与 y 位 进行 位 与 运算 
x 与 y 位 进行 位 或 运算 
x 与 y 位 进行 位 异 或 运算 
x 右 移 a 位 ,高 位 采用 符号 位 补 位 
x 左 移 a 位 ， 低 位 用 0 补 位 


位 运算 示例 代码 : 


# 代码 文件 chapter7/7.4/hello.py 


a = 0b10110010 (0 
b = 0b01011110 加 
print("a | b = {0}".format(a | b)) # 0bl1111110 回 
print("a & b = {0}".format(a & b)) # 0b00010010 四 
print("a ^ b = {0}".format(a ^ b)) # 0bl1101100 © 
print ("~a = {0}".format (~a)) # -179 © 
print("a >> 2 = {0}".format(a >> 2)) # 0b00101100 @ 
print("a << 2 = {0}".format(a << 2)) # 0b11001000 
c = -0b1100 
print("c >> 2 = {0}".format(c >> 2)) # -0b00000011 人 @ 
1 


print("c << 2 = {0}".format(c << 2)) # -0b00110000 
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输出 结果 如 下 : 


alb= 254 
ag&b=18 
a^b= 236 
~a = -179 
CB 
韦 区 昌 
GC 3> 2 
G <x< 2 三 =48 


上 述 代码 中 ， 第 @ 行 和 第 @ 行 分 别 声明 了 整数 变量 a 和 b， 采 用 二 进 制 表示 。 第 @ 行 声明 
变量 ce， 是 采用 二 进 制 表示 的 负 整 数 。 


注意 : a 和 b 位 数 是 与 本 机 相关 的 ， 虽 然 只 写 出 了 8 位 ， 但 笔者 计算 机 是 64 位 的 ， 所 以 a 
和 bb 都 是 64 位 数字 ， 只 是 在 本 例 中 省 略 了 前 56 个 零 。 位 数 多 少 并 不 会 影响 位 反 和 位 移 运 算 。 


代码 第 @ 行 (a | b) 表达 式 是 进行 位 或 运算 ， 结 果 是 二 进 制 的 0b11111110 (十 进 制 是 254)， 
它 的 运算 过 程 如 图 7-1 所 示 。 从 图 中 可 见 ，a 和 ob 按 位 进行 或 计算 ， 只 要 有 一 个 为 1， 计 算 结 
果 就 为 1， 否则 为 0。 

代码 第 @ 行 (a & b) 是 进行 位 与 运算 ， 结 果 是 二 进 制 的 0b00010010 (十 进 制 是 18)， 它 的 
运算 过 程 如 图 7-2 所 示 。 从 图 中 可 见 ，a 和 按 位 进行 与 计算 ， 只 有 两 位 全 部 为 1， 这 一 位 才 
为 1， 否则 为 0。 


a "oo a [oolo fo 
位 或 运算 位 与 运算 
b [oo fo b [°o lo oo | 
结果 国 副 | 副 到 | 到 | 到 | 到 | o 结果 [oolo [ofo |o] 
图 7-1 位 或 运算 图 7-2 位 与 运算 
代码 第 @ 行 (a ^ b) 是 进行 位 异 或 运算 ， 结 果 是 二 进 制 的 a [Tofforolaro 


0b11101100 (十 进 制 是 236)， 它 的 运算 过 程 如 图 7-3 所 示 。 从 异 或 位 运算 
图 中 可 见 ，a 和 bb 按 位 进行 异 或 计算 ， 只 有 两 位 相反 时 这 一 位 b [oo 
才 为 1， 否则 为 0。 

代码 第 @ 行 (-a) 是 按 位 取 反 运算 ， 这 个 过 程 中 需要 补 码 结果 [TI oo 
运算 ， 而 且 与 计算 机 位 数 有 关 。 笔 者 使 用 的 是 64 位 机 ， 所 以 图 7-3 异 或 位 运算 
计算 结果 是 -179。 

代码 第 @ 行 (a >> 2) 是 进行 右 位移 2 位 运算 ， 结 果 是 二 进 制 的 0b00101100 (十 进 制 是 
44)， 它 的 运算 过 程 如 图 7-4 所 示 。 从 图 中 可 见 ，a 的 低位 被 移 除 掉 ， 高 位 用 0 补 位 (注意 最 高 
位 不 是 1， 而 是 0， 在 1 前 面 还 有 56 个 0)。 

代码 第 @ 行 (a << 2) 是 进行 左 位 移 2 位 运算 ， 结 果 是 二 进 制 的 0b1011001000 (十 进 制 
是 712)， 它 的 运算 过 程 如 图 7-5 所 示 。 从 图 中 可 见 ， 由 于 本 机 是 64 位 ， 所 以 高 位 不 会 移 除 
掉 ， 低 位 用 0 补 位 。 但 是 需要 注意 ， 如 果 本 机 是 8 位 的 ， 高 位 会 被 移 除 掉 ， 结 果 是 二 进 制 的 
0b11001000 (十 进 制 是 310) 。 


o 


o 
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nnoaann 
CI 


图 7-4 右 位 移 2 位 运算 图 7-5 左 位 移 2 位 运算 


提示 : 代码 第 四 行 和 第 ! 行 是 对 负数 进行 位 运算 ， 负 数 也 涉及 补 码 运算 ， 如 果 对 负数 位 
移 运算 不 理解 可 以 先 忽 略 负 号 当成 正 整数 运行 ， 然 后 运算 出 结果 再 加 上 负 号 


提示 : 右 移 nn 位， 相当 于 操作 数 除 以 22， 例 如 代码 第 四 行 (a >> 2) 表达 式 相 当 于 (a / 2”)， 
178 /4 所 以 结果 等 于 44。 另 外 ， 左 位 移 n 位， 相当 于 操作 数 乘 以 2", 例如 代码 第 四 行 (a << 2) 
表达 式 相当 于 (a * 22)，178 * 4 所 以 结果 等 于 712， 类 似 的 还 有 代码 第 @@ 行 。 


7.5 赋值 运算 符 


赋值 运算 符 只 是 一 种 简写 ， 一 般 用 于 变量 自身 的 变化 ， 例 如 a 与 其 操作 数 进行 运算 结果 
再 赋值 给 a， 算术 运算 符 和 位 运算 符 中 的 二 元 运算 符 都 有 对 应 的 赋值 运算 符 。 具 体 说 明 参 见 表 
-So 


表 7-5 算术 赋值 运算 符 
说 明 

等 价 于 a=a+b 
等 价 于 a=a-b 
等 价 于 a=a*b 
等 价 于 a=a/b 
等 价 于 a=a%b 
等 价 于 a=a**b 
等 价 于 a=a//b 
等 价 于 a = a&b 
等 价 于 a = alb 
等 价 于 a=a^b 
等 价 于 a = a<<b 
等 价 于 a = a>>b 


i 
&= 位 与 赋值 


示例 代码 如 下 : 


# 代码 文件 : chapter7/7.5/hello.py 


a=1 
b=2 
a += b # 相当 于 a = a + b 


print("a | b = {0}".format (a)) # 输出 结果 是 3 


a+=b+3 
print("a + b + 
a -= b 

print("a - b = 


a x= b 


print("a * b= 


是 
print("a / b = 


a %= b 
Print("a % b= 


a = 0b10110010 
b = 0b01011110 


al=b 
print("a | b= 
sy 
print("a ^ b = 
输出 结果 如 下 : 
D3 
B43=8 
总 一 有 二 -各 
a*b= 12 
a/b= 6.0 
asgsb=0.0 
alb= 254 
a^*b= 254 


3=1 


{04". 


{0}". 


{01" 


{04" 


{0}". 


{0}". 


0}".format (a)) 


format (a) ) 


format (a) ) 


.format (a)) 


.format (a)) 


format (a)) 


format (a ^ b)) 


中 利 砷 虽 中 


和 


中 
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相当 于 a = at+b+3 
输出 结果 7 
相当 于 a = a - b 

输出 结果 6 


相当 于 a = a * b 
输出 结果 12 


相当 于 a = a / b 
输出 结果 6 


相当 于 a = a s b 
输出 结果 0 


上 述 例子 分 别 对 整 型 进行 了 赋值 运算 ， 具 体 语句 不 再 袭 述 。 


7.6 其 他 运算 符 


除了 前 面 介绍 的 主要 运算 符 ，Python 还 有 一 些 其 他 运算 符 ， 本 节 先 介绍 其 中 两 个 重要 的 国 时 
“测试 ”运算 符 ， 其 他 运算 符 后 面 涉及 相关 内 容 时 再 详细 介绍 。 这 两 个 “测试 ”运算 符 是 同一 
性 测试 运算 符 和 成 员 测 试 运算 符 ， 所 谓 “测试 ”就 是 判断 之 意 ， 因 此 它们 的 运算 结果 是 布尔 值 ， 轩 守 


它们 也 属于 关系 运算 符 。 
7.6.1 同一 性 测试 运算 符 


同一 性 测试 运算 符 就 是 测试 两 个 对 象 是 否 同一 个 对 象 ， 类 似 于 一 运算 符 ， 不 同 之 处 是 ， 


==- 是 测试 两 个 对 象 的 内 容 是 否 相 同 ， 当 然 如 果 是 同一 对 象 一 也 返回 True。 


示例 代码 如 下 。 


同一 性 测试 运算 符 有 两 个 : is 和 is not，is 是 判断 是 同一 对 象 ，is not 是 判断 不 是 同一 对 象 。 
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# coding=utf-8 
# 代码 文件 : chapter7/7.6/ch7.6.1.py 


class Person: [0) 
def _init (self, name, age): 
self.name = name 


self.age = age 


pl = Person('Tony', 18) 


p2 Person('Tony', 18) 

print (pl == p2) # False 
print(pl is p2) # False 
print(pl != p2) # True 
print(pl is not p2) # True 


上 述 代码 第 @ 四 行 自 定 义 类 Person， 它 有 两 个 实例 变量 name 和 age， 然 后 创建 了 两 个 
Person 对 象 p1 和 p2， 它 们 具有 相同 的 name 和 age 实例 变量 。 那 么 是 否 可 以 说 pl 与 p2 是 
同一 个 对 象 (pl is p2 为 True) ? 程序 运行 结果 不 是 ， 因 为 这 里 实例 化 了 两 个 Person 对 象 
(Person('Tony', 18) 语句 是 创建 对 象 ) 。 

那么 pl == p2 为 什么 会 返回 False 呢 ? 因为 == 虽然 是 比较 两 个 对 象 的 内 容 是 否 相 当 ， 但 
是 也 需要 告诉 对 象 比较 的 规则 是 什么 ， 是 比较 name 还 是 age ? 这 需要 在 定义 类 时 重 写 _ eq 
方法 ， 指 定 比较 规则 。 修 改 代码 如 下 : 


class Person: 
def _init (self, name, age): 
self.name = name 
self.age = age 


def _eq_ (self, other): 
if self.name == other.name and self.age == other.age: 
return True 
else: 
return False 


pl = Person('Tony', 18) 


p2 Person('Tony', 18) 

print (pl == p2) # True 
print (pl is p2) # False 
print (pl != p2) # False 
print (pl is not p2) # True 


上 述 代码 重 写 _eq 方法 ， 其 中 定义 了 只 有 在 name 和 age 都 同时 相等 时 ， 两 个 Person 
对 象 pl 和 p2 才 相 等 ， 即 pl == p2 为 True。 注 意 ，pl is p2 还 是 为 False 的 。 有 关 类 和 对 象 等 
细节 问题 ， 读 者 只 需要 知道 is 和 一 两 种 运算 符 的 不 同 即 可 。 


7:6.2 


成 员 测试 运算 符 
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成 员 测试 运算 符 可 以 测试 在 一 个 序列 〈sequence) 对 象 中 是 否 包含 某 一 个 元 素 。 成 员 测试 


素 。 
示例 代码 如 下 : 


# coding=utf-8 


# 代码 文件 chapter7/7.6/ch7.6.2.py 


string a = "Hello' 

print('e' in string a) # True 
print('ell' not in string a) # False 
list a = [1, 2] 

print(2 in list a) # True 
Print(1 not in list a) # False 


O 
@ 


加 
@ 


运算 符 有 两 个 : in 和 not in，in 是 测试 是 否 包含 菜 一 个 元 素 ，not in 是 测试 是 否 不 包含 某 一 个 
元 


上 述 代码 中 第 @ 行 是 判断 字符 串 Hello 中 是 否 包 含 e 字 符 ， 第 @ 行 是 判断 字符 串 Hello 中 
是 否 不 包含 e 字 符 串 ell， 这 里 需要 注意 的 是 字符 串 本 质 也 属于 序列 ， 此 外 还 有 列表 和 元 组 都 
属于 序列 ， 有 关 序 列 的 知识 会 在 第 9 章 详 细 介绍 。 
代码 第 @ 行 是 判断 list_a 列表 中 是 否 包含 2 元 素 ， 代 码 第 图 行 是 判断 list_a 列表 中 是 否 不 


包含 1 元 素 。 


7.7 ”运算 符 优先 级 


在 一 个 表达 式 计算 过 程 中 ， 运 算 符 的 优先 级 非常 重要 。 表 7-6 中 从 上 到 下 优先 级 从 高 到 上 


低 ， 同 一 行 具有 相同 的 优先 级 。 


表 7-6 运算 符 优先 级 


优 先 级 运 算 符 说 明 
1 0 小 括号 
2 信和 参数 ) 函数 调用 
3 [start:end]. [start:end:step] 分 片 
4 [index] 下 标 
5 本 引用 类 成 员 
6 4 二 笑 
7 ~ 位 反 
8 和 二 正 负 号 
9 二 人 乘法 、 除 法 、 取 余 
10 = 加 法 、 减 法 
11 <<,>> 位 移 
12 & 位 与 
13 An 位 异 或 


72 去 | Python 从 小 白 到 大 牛 


通过 表 7-6 读者 对 运算 符 优先 级 可 以 有 一 个 大 体 上 了 解 ， 知 道 运算 符 优先 级 大 体 顺 序 从 高 
到 低 是 : 算术 运算 符 一 位 运算 符 一 关系 运算 符 一 逻辑 运算 符 一 赋值 运算 符 。 还 有 一 些 运 算 符 没 
有 介绍 ， 后 面 会 逐一 介绍 。 


本 章 小 结 
通过 对 本 章 内 容 的 学 习 ， 读 者 可 以 了 解 到 Python 语言 运算 符 ， 这 些 运算 符 包括 算术 运 


算 符 、 关 系 运算 符 、 逻 辑 运算 符 、 位 运算 符 和 其 他 运算 符 。 本 章 最 后 介绍 了 Python 运算 符 
优先 级 。 


控制 语句 


程序 设计 中 的 控制 语句 有 三 种 ， 即 顺序 、 分 支 和 循环 语句 。Python 程序 通过 控制 语句 来 管 


理 程序 流 ， 完 成 一 定 的 任务 。 程 序 流 是 由 若干 个 语句 组 成 的 ， 语 句 既 可 以 是 一 条 单一 的 语句 ， 
也 可 以 是 复合 语句 。Python 中 的 控制 语句 有 以 下 几 类 。 


析 问 题 。 分 支 语 句 又 称 条 件 语句 ， 条 件 语句 使 部 分 程序 根据 某 些 表达 式 的 值 被 有 选择 地 执行 。 


。 分支 语句 : 让 
。 循环 语句 ，while 和 for 
， 跳 转 语句 : break、continue 和 return 


8.1 分支 语句 


分 支 语句 提供 了 一 种 控制 机 制 ， 使 得 程序 具有 了 “判断 能 力 ” 能 够 像 人 类 的 大 脑 一 样 分 国生 人 


Python 中 的 分 支 语句 只 有 站 语句 。 站 语句 有 让 结构 、if-else 结构 和 elif 结构 三 种 。 
8.1.1 这 结构 
如 果 条 件 计 算 为 True 就 执行 语句 组 ， 否 则 就 执行 让 结构 后 面 的 语句 。 语 法 结构 如 下 : 


译 : 条 件 : 
语句 组 


让 结构 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter8/8.1.1/hello.py 


[OL 
扫 码 看 视频 


import sys 
score = int(sys.argv[1]) # 获得 命令 行 传 入 的 参数 © 


if score >= 85: 


Print (" 您 真 优秀 ! ") 


if score < 60: 


print (" 您 需要 加 倍 努 力 ! ") 


if (score >= 60) and (score < 85) : 


print (" 您 的 成 绩 还 可 以 ， 仍 需 继续 努力 ! ") 
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为 了 灵活 输入 分 数 (score) 本 例 中 使 用 了 sys.argv，sys.argv 能 够 返回 命令 行 参 数列 表 ， 见 代 
码 第 四 行 。sys.argv[1] 返回 参数 列表 的 第 二 个 元 素 ， 因 为 第 一 个 元 素 sys.argv[0] 是 执行 的 Python 
文件 名 。 由 于 参数 列表 中 元 素 为 字符 串 ， 所 以 还 需要 使 用 int 函数 将 字符 串 转 换 为 int 类 型 。 另 
外 ， 为 了 使 用 sys.argv 命令 行 参 数列 表 ， 还 需要 在 文件 开始 通过 import sys 语句 导入 sys 模块 。 

执行 时 需要 打开 Windows 命令 行 提示 符 ， 输 入 如 下 指令 ， 如 图 8-1 所 示 。 


python ch8.1.1.py 80 


图 8-1 命令 行 参数 


如 果 程序 需要 获取 sys.argv[0] 元 素 ， 返 回 值 是 ch8.1.1.py。 


注意 : 使 用 sys.argv 获取 命令 行 参 数列 表 的 程序 代码 ， 不 能 在 Python Shell 环境 下 运行 获 
得 参数 列表 


8.1.2 ”if-else 结构 
几乎 所 有 的 计算 机 语言 都 有 这 个 结构 ， 而 且 结构 的 格式 基本 相同 ， 语 句 如 下 : 
if 条 件 : 

语句 组 1 


else. 3 


语句 组 2 


当 程 序 执行 到 寺 语 句 时 ， 先 判断 条 件 ， 如 果 值 为 True， 则 执行 语句 组 1， 然 后 跳 过 else 语 
句 及 语句 组 2， 继 续 执行 后 面 的 语句 。 如 果 条 件 为 False， 则 忽略 语句 组 1 而 直接 执行 语句 组 
2， 然 后 继续 执行 后 面 的 语句 。 
if-else 结构 示例 代码 如 下 


# coding=utf-8 
# 代码 文件 : chapter8/ch8.1.2.py 


import sys 
score = int(sys.argv[1]) # 获得 命令 行 传 入 的 参数 


if score >= 60: 
print (" 及格 ") 
if score >= 90: 
print ("优秀") 
else: 


print ("不 及 格 ") 
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示例 执行 过 程 参考 8.1.1 节 ， 这 里 不 再 资 述 。 
8.1.3 ”elif 结构 


el 站 结构 如 下 : 


if 条 件 1: 
语句 组 1 

elif 条 件 2: 
语句 组 2 

elif 条 件 3: 
语句 组 3 


elif 条 件 n: 
语句 组 
else: 


语句 组 n 十 1 


可 以 看 出 ，elif 结构 实际 上 是 if-else 结构 的 多 层 嵌 套 ， 它 明显 的 特点 就 是 在 多 个 分 支 中 只 
执行 一 个 语句 组 ， 而 其 他 分 支 都 不 执行 ， 所 以 这 种 结构 可 以 用 于 有 多 种 判断 结果 的 分 支 中 。 
el 站 结构 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter8/ch8.1.3.py 


import sys 


score = int(sys.argv[1]) # 获得 命令 行 传 入 的 参数 
if score >= 90: 
grade = 'A' 
elif score >= 80: 
grade = 'B' 
elif score >= 70: 
grade = 'C' 
elif score >= 60: 
grade = 'D' 
else: 
grade = 'F' 


print ("Grade = " + grade) 
示例 执行 过 程 参考 8.1.1 节 ， 这 里 不 再 袭 述 。 
8.1.4 ”三 元 运算 符 替代 品 一 一 条 件 表达 式 


在 前 面 学 习 运 算 符 时 ， 并 没有 提 到 类 似 Java 语言 的 三 元 运算 符 了 ?。 为 提供 类 似 的 功能 ， 
了 Python 提供 了 条 件 表达 式 ， 条 件 表达 式 语法 如 下 : 
表达 式 1 if 条 件 else 表达 式 2 


@ 三 元 运算 符 的 语法 形式 : 条 件 ? 表达 式 1 : 表达 式 2， 当 条 件 为 真 时 ， 表 达 式 1 返回 ， 否 则 表达 式 2 返回 。 
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其 中 ， 当 条 件 计 算 为 True 时 ， 返 回 表达 式 1， 否 则 返回 表达 式 2。 
条 件 表达 式 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter8/ch8.1.4.py 
import sys 


score = int(sys.argv[1]) # 获得 命令 行 传 入 的 参数 


result = ' 及格 ' if score >= 60 else ' 不 及 格 ' 

print (result) 

示例 执行 过 程 参考 8.1.1 节 ， 这 里 不 再 资 述 。 

从 示例 可 见 ， 条 件 表达 式 事实 上 就 是 if-else 结构 ， 而 普通 的 if-else 结构 不 是 表达 式 ， 不 
会 有 返回 值 ， 而 条 件 表达 式 不 但 进行 条 件 判断 ， 而 且 还 会 有 返回 值 。 


8.2 循环 语句 
循环 语句 能 够 使 程序 代码 重复 执行 。Python 支持 while 和 for 两 种 循环 构造 类 型 。 
8.2.1 while 语句 
while 语句 是 一 种 先 判断 的 循环 结构 ， 格 式 如 下 : 
while 循环 条 件 : 
语句 组 
[else: 
语句 组 ] 


while 循环 没有 初始 化 语句 ， 循 环 次 数 是 不 可 知 的 ， 只 要 循环 条 件 满足 ， 循 环 就 会 一 直 执 
行 循环 体 。while 循环 中 可 以 带 有 else 语句 ，else 语句 将 在 8.3 节 详 细 介 绍 。 
下 面 看 一 个 简单 的 示例 ， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter8/ch8.2.1.py 


六 二 性 

while i * i < 100 000: 
i+=1 

print ("i = {0}".format (i)) 


print ("i * = {0}".format(i * 1)) 


输出 结果 如 下 : 


Li 3 
生 雪 和 三 004689 


上 述 程 序 代码 的 目的 是 找到 平方 数 小 于 100_000 的 最 大 整数 。 使 用 while 循环 需要 注意 ， 
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while 循环 条 件 语句 中 只 能 写 一 个 表达 式 ， 而 且 是 一 个 布尔 型 表达 式 ， 那 么 如 果 循 环 体 中 需要 
循环 变量 ， 就 必须 在 while 语句 之 前 对 循环 变量 进行 初始 化 。 本 例 中 先 给 i 赋值 为 0， 然 后 必 
须 在 循环 体内 部 通过 语句 更 改 循环 变量 的 值 ， 否 则 将 会 发 生死 循环 。 

提示 : 为 了 阅读 方便 ， 整 数 和 浮 点 数 均 可 添加 多 个 0 或 下 画 线 以 提高 可 读 性 ， 如 
000.01563 和 _360 000， 两 种 格式 均 不 会 影响 实际 值 。 一 般 是 每 三 位 加 一 个 下 画 线 。 


8.2.2 for 语句 


for 语句 是 应 用 最 广泛 、 功 能 最 强 的 一 种 循环 语句 。Python 语言 中 没有 C 语言 风格 的 for 
语句 ， 它 的 for 语句 相等 于 Java 中 增强 for 循环 语句 ， 只 用 于 序列 ， 序 列 包 括 字 符 串 、 列 表 和 
元 组 。 
for 语句 一 般 格 式 如 下 : 
for 和 迭代 变量 in 序列 : 
语句 组 
[else: 


语句 组 ] 


“序列 ”表示 所 有 的 实现 序列 的 类 型 都 可 以 使 用 for 循环 .“ 和 迭代 变量 ”是 从 序列 中 迭代 取 
出 的 元 素 。for 循环 中 也 可 以 带 有 else 语句 ，else 语句 将 在 8.3 节 详 细 介 绍 。 
示例 代码 如 下 : 


# coding=utf-8 


print ("---- 范围------- i 

for num in range(1，10) : # 使 用 范围 O 
print("{0} x {0} = {1}".format (num, num * num) ) 

BisiaEtr==== 年 特 训 :======= 只 

# ”for 语句 

for item in 'Hello': [2 


print (item) 


# 声明 整数 列表 
numbers = [43, 32, 53, 54, 75, 7, 10] @ 


Beint1t"==== 整数 列表 -=== 一 | 
# ”for 语句 


for item in numbers: @ 


print ("Count is : {0}".format (item)) 
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4X4=16 

5 X 5= 25 

6 X 6=36 
7X7=49 

8 X 8= 64 

9 X 9=81 
~ 
H 

e 

1 

和 

oo 

==== 基数 列 旨 三 ====== 


Count is : 43 
Count is : 32 
Count is : 53 
Count is : 54 
Count is : 75 
Count is : 7 
Count is : 10 


上 述 代码 第 @ 行 range(1, 10) 函数 是 创建 范围 (range) 对 象 ， 它 的 取 值 是 1 < range(1, 10)<10， 
步 长 为 1， 总 共 10 个 整数 。 范 围 也 是 一 种 整数 序列 ， 关 于 范围 会 在 8.4 节 详细 介绍 。 代 码 第 @ 
行 是 循环 字符 串 Hello， 字 符 串 也 是 一 个 序列 ， 所 以 可 以 用 for 循环 变量 。 代 码 第 @ 行 是 定义 
整数 列表 ， 关 于 列表 会 在 后 面 第 9 章 详 细 介 绍 。 代 码 第 @ 行 是 遍历 列表 numbers。 


8.3” 跳 转 语句 


回 跳 转 语句 能 够 改变 程序 的 执行 顺序 ， 可 以 实现 程序 的 跳 转 。Python 有 3 种 跳 转 语句 : break、 
ontinue 和 return。 本 节 重 点 介绍 break 和 continue 语句 的 使 用 。return 将 在 后 面 章 节 介 绍 。 


加 5 
避 码 看 祝 上 8.3.1 break 语句 


break 语句 可 用 于 8.2 节 介绍 的 while 和 for 循环 结构 ， 它 的 作用 是 强行 退出 循环 体 ， 不 再 
执行 循环 体 中 剩余 的 语句 。 
下 面 看 一 个 示例 ， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter8/ch8.3.1.py 


for item in range(10): 
if item == 3: 
# 跳出 循环 
break 


print ("Count is : {0}".format (item)) 


在 上 述 程序 代码 中 ， 当 条 件 item ==3 的 时 候 执行 break 语句 ，break 语句 会 终止 循环 。 
Tange(10) 函数 省 略 了 开始 参数 ， 默 认 是 从 0 开始 的 。 程 序 运 行 的 结果 如 下 : 
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Count is : 0 
Count is : 1 
2 


Count is : 


8.3.2 continue 语句 


continue 语句 用 来 结束 本 次 循环 ， 跳 过 循环 体 中 尚未 执行 的 语句 ， 接 着 进行 终止 条 件 的 判 
以 决定 是 否 继续 循环 。 
下 面 看 一 个 示例 ， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter8/ch8.3.2.py 


标 


for item in range(10): 
if item == 33 
continue 
print("Count is : {0}".format (item)) 


在 上 述 程序 代码 中 ， 当 条 件 item ==3 的 时 候 执行 continue 语句 ，continue 语句 会 终止 本 
次 循环 ， 循 环 体 中 continue 之 后 的 语句 将 不 再 执行 ， 接 着 进行 下 次 循环 ， 所 以 输出 结果 中 没有 
3。 程 序 运行 结果 如 下 : 


Count is: 
Count is: 
Count is: 
Count is: 
Count is: 
Count is: 
Count is: 
Count is: 


wo ro 


Count is: 


8.3.3 ”while 和 for 中 的 else 语句 


在 前 面 8.2 节 介绍 while 和 for 循环 时 ， 提 到 过 它们 都 可 
以 跟 else 语句 ， 它 与 过 语句 中 的 else 不 同 。 这 里 的 else 是 在 
循环 体 正 常 结 束 时 才 运 行 的 代码 ， 当 循环 被 中 断 时 不 执行 ， 
break、return 和 异常 抛 出 都 会 中 断 循环 。 循 环 中 的 else 语句 


。 a 是 否 遇 到 
流程 图 如 图 8-2 所 示 。 breaksuretwmn 和 时 
常 殷 出 


示例 代码 如 下 : 

# coding=utf-8 

# 代码 文件 ， chapter8/ch8.3.3.py 

执行 else 语 句 

=0 

while i * i < 10: 
i+=1 


站 图 8-2 循环 中 的 else 语句 
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# break 
print("{0} * {0} = {1}".format(i, i * 1)) 
else: 


print ('While Over!') 


for item in range(10): 
if item == 3; 
break 
print ("Count is : {0}".format (item)) 
else: 
print('For Over!') 


0 
Count is : 1 
Count is : 2 
上 述 代码 中 在 while 循环 中 break 语句 被 注释 了 ， 因 此 会 进入 else 语句， 所 以 最 后 输出 
“While Over! ”。 而 在 for 循环 中 当 条 件 满足 时 break 语句 执行 ， 程 序 不 会 进入 else 语句 ， 最 后 
没有 输出 “For Over! ”。 


8.4 使 用 范围 


回 在 前 面 的 学 习 过 程 中 多 次 需要 使 用 范围 ， 范 围 在 Python 中 类 型 是 range， 表 示 一 个 整数 序 
列 ， 创 建 范 围 对 象 需 使 用 range() 函数 ，range() 函数 语法 如 下 : 


回 
扫 码 看 视频 range([start,] stop[, step]) 
其 中 的 三 个 参数 全 部 是 整数 类 型 ，start 是 开始 值 ， 可 以 省 略 ， 表 示 从 0 开始 ;stop 是 结束 值 ; 


step 是 步 长 。 注 意 start 志 整数 序列 取 值 < stop， 步 长 step 可 以 为 负数 ， 可 以 创建 递减 序列 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter8/ch8.3.4.py 


for item in range(l, 10, 2): (0) 


print ("Count is : {0}".format (item)) 


第 8 章 控制 语句 | 基 81 


for item in range(1，-10，-3) : © 
print ("Count is : {0}".format(item)) 

输出 结果 如 下 : 

Count is 


Count is = 了 
Count is -6 
Count is ~ 


上 述 代码 第 Q@ 行 是 创建 一 个 范围 ， 步 长 是 2， 有 5 个 元 素 ， 包 含 的 元 素 见 输出 结果 。 代 码 
第 @ 行 是 创建 一 个 递减 范围 ， 步 长 是 -3， 有 4 个 元 素 ， 包 含 的 元 素 见 输 出 结果 。 


本 章 小 结 


通过 对 本 章 内 容 的 学 习 ， 读 者 可 以 了 解 到 Python 语言 的 控制 语句 ， 其 中 包括 分 支 语句 过、 
循环 语句 〈while 和 for) 和 跳 转 语句 (break 和 continue) 等 。 最 后 还 介绍 了 范围 。 


据 结 
理 。 


Oooooooo 


第 二 篇 
Python 进 阶 


本 篇 包括 7 章 内 容 ， 系 统 介 绍 了 Python 语言 进 阶 相关 知识 。 内 容 包括 Python 数 
构 ， 部 数 式 编程 ， 面 向 对 象 ， 异 常 处 理 ， 常 用 模块 ， 正 则 表达 式 和 文件 操作 与 管 
通过 本 篇 的 学 习 ， 读 者 可 以 全 面 了 解 Python 语言 的 进 阶 知识 


第 9 章 数据 结构 

第 10 章 函数 式 编程 

第 11 章 面向 对 象 编程 
第 12 章 异常 处 理 

第 13 章 常用 模块 

第 14 章 正则 表达 式 

第 15 章 文件 操作 与 管理 


与 


当 你 有 很 多 书 时 ， 你 会 考虑 买 一 个 书柜 ， 将 你 的 书 分 门 别 类 地 摆 放 进去 。 使 用 了 书柜 不 
仅 使 房间 变 得 整洁 ， 也 便于 以 后 使 用 书 时 查找 。 在 计算 机 程序 中 会 有 很 多 数据 ， 这 些 数据 也 
需要 一 个 容器 将 它们 管理 起 来 ， 这 就 是 数据 结构 ， 常 见 的 有 数组 (Array)、 集 合 (SeDD、 列 
表 (List)、 队 列 (Queue)、 链 表 (Linkedlisb、 树 (Tree)、 堆 (Heap)、 栈 (Stack) 和 字典 
(CDictionary) 等 结构 。 

Python 中 数据 结构 主要 有 序列 、 集 合 和 字典 。 

注意 : Python 中 并 没有 数组 结构 ， 因 为 数组 要 求 元 素 类 型 是 一 致 的 。 而 Python 作为 动态 
类 型 语言 ， 不 强制 声明 变量 的 数据 类 型 ， 也 不 强制 检查 元 素 的 数据 类 型 ， 不 能 保证 元 素 的 数据 
类 型 一 致 ， 所 以 Python 中 没有 数组 结构 。 


数据 结构 


9.1 元 组 
元 组 (tuple) 是 一 种 序列 (sequence) 结构 ， 下 面 先 来 介绍 一 些 序列 。 


9.1.1 序列 


序列 是 一 种 可 迭代 的 ?、 元 素 有 序 、 可 以 重复 出 现 的 数据 结构 。 
序列 可 以 通过 索引 访问 元 素 。 图 9-1 是 一 个 班级 序列 ， 其 中 有 一 些 
学 生 ， 这 些 学 生 是 有 序 的 ， 顺 序 是 他 们 被 放 到 序列 中 的 顺序 ， 可 以 
通过 序号 访问 他 们 。 这 就 像 老师 给 进入 班级 的 人 分 配 学 号 ， 第 一 个 
报到 的 是 张 三 ， 老 师 给 他 分 配 的 是 0， 第 二 个 报到 的 是 李 四 ， 老 师 
给 他 分 配 的 是 1， 以 此 类 推 ， 最 后 一 个 序号 应 该 是 “学 生 人 数 -1”。 

序列 包括 的 结构 有 列表 (ist)、 字 符 串 (str)、 元 组 、 范 围 
(range) 和 字 节 序列 (bytes) 。 序 列 可 进行 的 操作 有 索引 、 分 片 、 加 
和 乘 。 

1) 索引 操作 

序列 中 第 一 个 元 素 的 索引 是 0， 其 他 元 素 的 索引 是 第 一 个 元 素 
的 偏 移 量 。 可 以 有 正 偏 移 量 ， 称 为 正 值 索 引 ， 也 可 以 有 负 偏 移 量 ， 
称 为 负 值 索 引 。 正 值 索 引 的 最 后 一 个 元 素 索引 是 “序列 长 度 -1” 


扫 码 看 视频 


@ 可 和 帮 代 (iterable) 是 指 它 的 成 员 能 返回 一 次 的 对 象 。 
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负 值 索引 最 后 一 个 元 素 索 引 是 “ -1”。 例 如 Hello 字符 串 ， 它 的 正 值 索引 如 图 9-2 〈(a) 所 示 ， 
负 值 索引 如 图 9-2 (b) 所 示 。 


ms [az al [FE 
> [Hehrhio se [He To 


(a) (b) 
图 9-2 ” 正 负 索 引 示例 


序列 中 的 元 素 是 通过 索引 下 标 访问 的 ， 即 中 括号 [index] 方式 访问 。 在 Python Shell 中 运 
行 示例 如 下 : 


>>> = “Belle 
>>> a[0] 
‘HH! 
>>> a[1] 
CP 
>>> a[4] 
CP 
>>> a[-1] 
ot 
>>> a[-2] 
‘1 
>>> a[5] 
Traceback (most recent call last): 

File "<pyshell#2>", line 1, in <module> 

a[5] 

IndexError: string index out of range 


>>> max (al) 
CP 

>>> min(a) 
‘HH! 

>>> len(a) 
5 


a[0] 是 所 访问 序列 的 第 一 个 元 素 ， 最 后 一 个 元 素 的 索引 可 以 是 4 或 -1。 但 是 索引 超过 范 
围 ， 则 会 发 生 IndexError 错误 。 另 外 ， 获 取 序 列 的 长 度 使 用 函数 len， 类 似 的 序列 还 有 max 和 
min 函数 ，max 函数 返回 最 后 一 个 元 素 ，min 函数 返回 第 一 个 元 素 。 

2) 序列 的 加 和 乘 

在 前 面 第 7 章 介绍 + 和 * 运算 符 时 ， 提 到 过 它们 可 以 应 用 于 序列 。+ 运算 符 可 以 将 两 个 序 
列 连接 起 来 ,* 运算 符 可 以 将 序列 重复 多 次 。 

在 Python Shell 中 运行 示例 如 下 : 

>>> a = "Hello" 

>3> a 

"HelloHelloHello' 

>>> print (a) 

Hello 

353% di 
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>>> a += 'World'" 
>>> print (a) 
Hello World 


3) 序列 分 片 
序列 的 分 片 〈Slicing) 就 是 从 序列 中 切 分 出 小 的 子 序列 。 分 片 使 用 分 片 运 算 符 ， 分 片 运 算 
符 有 两 种 形式 。 
。 [start:end]:， start 是 开始 索引 ，end 是 结束 索引 。 
。 [start:end:step] : start 是 开始 索引 ，end 是 结束 索引 ，step 是 步 长 ， 步 长 是 在 分 片 时 获取 
元 素 的 间隔 。 步 长 可 以 为 正 整 数 ， 也 可 为 负 整数 。 


注意 : 切 下 的 分 片 包括 start 位 置 元 素 ， 但 不 包括 end 位 置 元 素 ，start 和 end 都 可 以 省 略 。 


在 Python Shell 中 运行 示例 代码 如 下 : 


>>> a[1:3] 
el， 
>>> a[:3] 
"Hel'" 
>>> a[0:3] 
'Hel' 
>>> a[0:] 
'Hello' 
>>> a[0:5] 
'Hello' 
>>> a[:] 
"Hel1lo" 
>>> a[1:-1] 
"el1? 


上 述 代码 表达 式 a[1:3] 是 切 出 1~3 的 子 字 符 串 ， 注 意 不 包括 3， 所 以 结果 是 el。 表达 式 
a[:3] 省 略 了 开始 索引 ， 默 认 开始 索引 是 0， 所 以 a[:3] 与 a[0:3] 分 片 结果 是 一 样 的 。 表 达 式 
a[0:] 省 略 了 结束 索引 ， 默 认 结束 索引 是 序列 的 长 度 ， 即 5。 所 以 a[0:] 与 a[0:5] 分 片 结果 是 一 
样 的 。 表 达 式 a[:] 省 略 了 开始 索引 和 结束 索引 ，a[:] 与 a[0:5] 结果 一 样 。 

另外 ， 表 达 式 a[1:-1] 使 用 了 负 值 索引 ， 对 照 图 9-1， 不 难 计算 出 a[1:-1] 结果 是 ell。 

分 片 时 使 用 [start:end:step] 可 以 指定 步 长 (step)， 步 长 与 当 次 元 素 索 引 、 下 次 元 素 索 引 之 
间 的 关系 如 下 : 


下 次 元 素 索 引 = 当 次 元 素 索引 + 步 长 
在 Python Shell 中 运行 示例 代码 如 下 : 


>>> allssl 
"ello' 

>>> a[1:5:2] 
‘vel! 

>>> a[0:3] 
"el" 

>>> a[0:3:2] 
rH1! 
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>>> a[0:3:3] 
‘Hl! 

>>> af[::-1] 
"olleH' 


表达 式 a[1:5] 省 略 了 步 长 参数 ， 步 长 默认 值 是 1。 表 达 式 a[1:5:2] 步 长 为 2， 结 果 是 el。 
a[0:3] 分 片 后 的 字符 串 是 Hel。 而 a[0:3:3] 步 长 为 3， 分 片 结果 是 五 字符 。 当 步 长 为 负数 时 比 
较 麻 烦 ， 负 数 时 是 从 右 往 左 获取 元 素 ， 所 以 表达 式 a[::-1] 分 片 的 结果 是 原始 字符 串 的 倒置 。 


9.1.2 ”创建 元 组 


元 组 是 一 种 不 可 变 序列 ， 一 旦 创建 就 不 能 修改 。 创 建 元 组 可 以 使 用 tuple([iterable]) 函数 或 
者 直接 用 逗号 “,” 将 元 素 分 隔 。 
在 Python Shell 中 运行 示例 代码 如 下 : 


>>> 21,32,43,45 

(21, 32, 43, 45) 

>>> (21, 32, 43, 45) 

(21, 32, 43, 45) 

>>> a = (21,32,43,45) 

>>> print(a) 

(21, 32, 43, 45) 

>>> ('Hello', 'World') 
('Hello', 'World') 

>>> ('Hello', 'World', 1,2,3) 
('Hello', ‘World', 1, 2, 3) 
>>> tuple([21,32,43,45]) 
(21, 32, 43, 45) 


代码 第 @ 行 创建 了 一 个 有 4 个 元 素 的 元 组 ， 创 建 元 组 时 使 用 小 括号 把 元 素 括 起 来 不 是 必需 
的 ;代码 第 @ 行 使 用 小 括号 将 元 素 括 起 来 ， 这 只 是 为 了 提高 程序 的 可 读 性 ， 代 码 第 @ 行 创建 了 
一 个 字符 串 元 组 ， 代 码 第 @ 行 创建 了 字符 串 和 整数 混合 的 元 组 。Python 中 没有 强制 声明 数据 类 
型 ， 因 此 元 组 中 的 元 素 可 以 是 任何 数据 类 型 。 

另外 ， 元 组 还 可 以 通过 tuple([iterable]) 函数 创建 ， 参 数 iterable 可 以 是 任何 可 夫 代 对 象 。 
代码 第 @ 行 使 用 了 tuple0 函数 创建 元 组 对 象 ， 实 参 [21,32,43,45] 是 一 个 列表 ， 列 表 是 可 和 迭代 
对 象 ， 可 以 作为 tuple() 函数 参数 创建 元 组 对 象 。 

创建 元 组 还 需要 注意 如 下 极端 情况 : 

>>> a = (21) 

>>> type (a) 

<class 'int'> 

>>> a = (21,) 

>>> type (a) 

<class 'tuple'> 

>>> a = () 

>>> type (a) 

<class 'tuple'> 


从 上 述 代码 可 见 ， 当 一 个 元 组 只 有 一 个 元 素 时 ， 后 面 的 逗号 不 能 省 略 ， 即 (21,) 表示 的 是 
只 有 一 个 元 素 的 元 组 ， 而 (21) 表示 的 是 一 个 整数 。 另 外 ，0 可 以 创建 空 元 组 。 


88 梧 Python 从 小 白 到 大 牛 


9.1.3 ”访问 元 组 


元 组 作为 序列 可 以 通过 下 标 索引 访问 其 中 的 元 素 ， 也 可 以 对 其 进行 分 片 。 在 Python Shell 
中 运行 示例 代码 如 下 : 


>>> a = ('Hello', 'World', 1,2,3) @ 
>>> a[1] 

"World' 

>>> a[1:3] 

('World', 1) 

>>> a[2:] 

GQ 2 

>>> a[:2] 

('Hello', 'World') 


上 述 代 码 第 @ 行 是 元 组 a，af[1] 是 访问 元 组 第 二 个 元 素 ， 表 达 式 a[1:3]、a[2:] 和 a[:2] 都 是 
分 片 操作 。 

元 组 还 可 以 进行 拆 包 (Unpack) 操作 ， 就 是 将 元 组 的 元 素 取出 赋值 给 不 同 变量 。 在 Python 
Shell 中 运行 示例 代码 如 下 : 


>>> a = ('Hello', 'World', 1,2,3) 

>>> strl, str2, nl,n2, n3 = a [0 
>>> strl 

'Hello' 

>>> str2 

?World' 

>>> nl 

1 

>>> n2 


4 


2 m3 

3 

>>> strl, str2, *n =a [0 
>>> strl 

'Hello' 

>>> str2 

'World' 

>>> n 

LL 

S93> EE1;_ ynlsn2, = a @ 


上 述 代码 第 中 行 是 将 元 组 a 进行 拆 包 操 作 ， 接 收 拆 包 元 素 的 变量 个 数 应 该 等 于 元 组 个 数 ， 
接收 变量 个 数 可 以 少 于 元 组 个 数 。 代 码 第 @ 行 接收 变量 个 数 只 有 3 个 ， 最 后 一 个 很 特殊 ， 变 量 
n 前 面 有 星 号 ， 表 示 将 剩 下 的 元 素 作为 一 个 列表 赋值 给 变量 n。 另 外 ， 还 可 以 使 用 下 画 线 指定 
不 取 值 哪些 元 素 ， 代 码 第 @ 行 表示 不 取 第 二 个 和 第 五 个 元 素 。 


9.1.4 ”遍历 元 组 
一 般 使 用 for 循环 遍历 元 组 ， 示 例 代码 如 下 。 
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# coding=utf-8 
# 代码 文件 : chapter9/ch9.1.4.py 


for item in a: O 


print (item) 


for i, item in enumerate(a): @ 
print('{0} - {1}'.format (i, item)) 


输出 结果 如 下 : 


2 


一 般 情况 下 遍历 目的 只 是 取出 每 一 个 元 素 值 ， 见 代码 第 @ 行 的 for 循环 。 但 有 时 需要 在 遍 
历 过 程 中 同时 获取 索引 ， 这 时 可 以 使 用 代码 第 @ 行 的 for 循环 ， 其 中 enumerate(a) 函数 可 以 获 
得 元 组 对 象 ， 该 元 组 对 象 有 两 个 元 素 ， 第 一 个 元 素 是 索引 ， 第 二 个 元 素 是 数值 。 所 以 (i, item) 
是 元 组 拆 包 过 程 ， 最 后 变量 i 是 元 组 a 的 当前 索引 ，item 是 元 组 a 的 当前 元 素 值 。 


注意 : 本 节 介绍 的 元 组 遍历 方式 适合 于 所 有 序列 ， 如 字符 串 、 范 围 和 列表 等 。 


9.2 列表 


列表 〈lisb 也 是 一 种 序列 结构 ， 与 元 组 不 同 ， 列 表 具 有 可 变性 ， 可 以 追加 、 插 入 、 删 除 和 加 
替换 列表 中 的 元 素 。 | 


9.2.1 列表 创建 


创建 列表 可 以 使 用 list([iterable]) 函数 ， 或 者 用 中 括号 [] 将 元 素 括 起 来 ， 元 素 之 间 用 逗号 
分 隔 。 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> [20, 10, 50, 40, 30] © 
[20, 10, 50, 40, 30] 

>>> [] 

[] 

>>> ['Hello', 'World', 1, 2, 3] @ 


['Hello', 'World', 1, 2, 3] 
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>>> a= [10] 回 
>>> type (a) 

<class 'list'> 

>>> a = [10,] @ 
>>> type (a) 

<class 'list'> 

>>> list((20, 10, 50, 40, 30)) © 
[20, 10, 50, 40, 30] 


上 述 代码 第 @ 行 创建 了 一 个 有 5 个 元 素 的 列表 ， 注 意 中 括号 不 能 省 略 ， 如 果 省 略 了 中 括号 
那 就 变 成 元 组 了 。 创 建 空 列 表 是 [] 表达 式 。 列 表 中 可 以 放 入 任何 对 象 ， 代 码 第 @ 行 是 创建 一 
个 字符 串 和 整数 混合 的 列表 。 代 码 第 @@ 行 是 创建 只 有 一 个 元 素 的 列表 ， 中 括号 不 能 省 略 。 另 
外 ， 无 论 是 元 组 还 是 列表 ， 每 一 个 元 素 后 面 都 跟着 一 个 逗号 ， 只 是 最 后 一 个 元 素 的 逗号 经 常 是 
省 略 的 ， 代 码 第 @@ 行 最 后 一 个 元 素 没 有 省 略 去 号 。 

另外 ， 列 表 还 可 以 通过 list([iterable]) 函数 创建 ， 参 数 iterable 是 任何 可 和 迭代 对 象 。 代 码 第 
回 行 使 用 list0 函数 创建 列表 对 象 ， 实 参 (20, 10, 50, 40, 30) 是 一 个 元 组 ， 元 组 是 可 和 迭代 对 象 
可 以 作为 list() 函数 参数 创建 列表 对 象 。 


9.2.2 ”追加 元 素 


列表 中 追加 单个 元 素 可 以 使 用 append0 方法 。 如 果 想 追加 另 一 列表 ， 可 以 使 用 + 运算 符 
或 extend() 方法 。 
append() 方法 语法 : 


list.append(x) 


其 中 x 参数 是 要 追加 的 单个 元 素 值 。 
extend() 方法 语法 : 


list.extend(t) 


其 中 t 参 数 是 要 追加 的 另外 一 个 列表 。 
在 Python Shell 中 运行 示例 代码 如 下 : 


>>> student_list = [' 张 三 "'，' 李 四 '，' 王 五 '] 

>>> student_1list.append(' 董 六 ') @ 
>>> student list 

| 

>>> student_list += [' 刘备 '，' 关羽 '] [@ 
>>> student list 

[个 张 三 " " 闻 网 "于 五 " 莹 六 "“ 剂 新 '“" 美 对 ' 

>>> student list.extend([' 张 闵 '，' 赵云 ']) @ 
>>> student list 


[' 张 三"，' 李 四 '，' 王 五 "，' 董 六 '，“， 刘备 '，' 关羽 '，' 张 飞 '，' 赵云 '] 
上 述 代 码 中 第 @@ 行 使 用 了 append 方法 ， 在 列表 后 面 追 加 了 一 个 元 素 ，append0 方法 不 能 


同时 追加 多 个 元 素 。 代 码 第 @ 行 利用 += 运算 符 追 加 多 个 元 素 ， 能 够 支持 += 运算 是 因为 列表 
支持 + 运算 。 代 码 第 @ 行 使 用 了 extend0 方法 追加 多 个 元 素 。 
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9.2.3 ”插入 元 素 


插入 元 素 可 以 使 用 列表 的 insert( 方法 ， 该 方法 可 以 在 指定 索引 位 置 插入 一 个 元 素 。 
insert() 方法 语法 : 


list.insert (i, x) 


其 中 参数 i 是 要 插入 的 索引 ， 参 数 x 是 要 插入 的 元 素数 值 。 
在 Python Shell 中 运行 示例 代码 如 下 : 
>>> student list = [" 张 三 "，" 幸 四 "; "于 五 "] 
>>> student list.insert(2,，' 刘备 ') 


>>> student list 
[" 张 三 "。" 李 四 "， "刘备"; "斑斑 "] 


上 述 代码 中 student_list 调用 insert 方法 ， 在 索引 2 位 置 插入 一 个 元 素 ， 新 元 素 的 索引 为 2。 
9.2.4 ”替换 元 素 


列表 具有 可 变性 ， 其 中 的 元 素 蔡 换 很 简单 ， 通 过 列表 下 标 将 索引 元 素 放 在 赋值 符号 “=?” 
左边 ， 进 行 赋值 即 可 替换 。 在 Python Shell 中 运行 示例 代码 如 下 : 

>>> student_list = [' 张 三 "'，' 李 四 '， ' 王 五 '] 

>>> student_list[0] = " 诸葛亮 " 


>>> student list 


[' 诸葛 亮 '，' 李 四 '，“' 刘备 '，' 王 五 '] 
其 中 student_list[0] =" 诸葛 亮 " 替换 了 列表 student_list 的 第 一 个 元 素 。 


9.2.5 ”删除 元 素 


列表 中 实现 删除 元 素 有 两 种 方式 ， 一 种 是 使 用 列表 的 remove() 方法 ， 另 一 种 是 使 用 列表 
的 pop0 方法 。 

1) remove() 方法 

remove() 方法 从 左 到 右 查找 列表 中 的 元 素 ， 如 果 找 到 匹配 元 素 则 删除 ， 注 意 如 果 找 到 多 个 
匹配 元 素 ， 只 是 删除 第 一 个 ， 如 果 没 有 找到 则 会 抛 出 错误 。 


remove() 方法 语法 : 
list.remove (x) 
其 中 x 参数 是 要 找 的 元 素 值 。 
使 用 remove() 方法 删除 元 素 ， 示 例 代码 如 下 : 
>>> student list = [" 张 三 *;" 李 四 I"。" 王 五 *，' 斑 五 *] 


>> student_list.remove(' 王 五 ') 
>>> student list 

【' 张 三 ",。"' 李 四 "，。"' 斑 五 '] 

>>> student_ list.remove(' 王 五 ') 
>>> student list 

1 计 三 "下 这 网 :*] 
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2) pop() 方法 
pop0( 方法 也 会 删除 列表 中 的 元 素 ， 但 它 会 将 成 功 删除 的 元 素 返 回 。 
pop() 方法 语法 如 下 : 


item = list.pop([i]) 


参数 i 是 指定 删除 元 素 的 索引 , i 可 以 省 略 ， 表 示 删 除 最 后 一 个 元 素 。 返 回 值 item 是 删除 的 元 素 。 
使 用 pop0 方法 删除 元 素 示例 代码 如 下 : 


>>> student_list = [" 张 三 "'，' 李 四 '，' 王 五 '] 
>>> student list.pop() 

文章 

>>> student list 

["' 张 三 "。" 地 四 '] 

>>> student list.pop(0) 

!' 张 三 ' 

>>> student list 


[' 李 四 '] 


9.2.6 ”其 他 常用 方法 


前 面 介绍 列表 追加 、 插 入 和 删除 时 ， 已 经 介绍 了 一 些 方法 。 事 实 上 列表 还 有 很 多 方法 ， 本 
节 再 介绍 几 个 常用 的 方法 。 

。reverse(): 倒置 列表 ; 

。copy(0: 复制 列表 ; 

。clear(): 清除 列表 中 的 所 有 元 素 ; 

，index(x[, i[, j]]) : 返回 查找 x 第 一 次 出 现 的 索引 ，i 是 开始 查找 索引 ，j 是 结束 查找 索引 ， 

该 方法 继承 自序 列 ， 元 组 和 字符 串 也 可 以 使 用 该 方法 ; 
，count(x): 返回 x 出 现 的 次 数 ， 该 方法 继承 自序 列 ， 元 组 和 字符 串 也 可 以 使 用 该 方法 。 
在 Python Shell 中 运行 示例 代码 如 下 : 


53> a = 21, 327 43; 451 


>>> a.reverse() O 
>>> a 

[45, 43, 32, 21] 

>>> b = a.copy() @ 
>>> b 

[45, 43, 32, 21] 

>>> a.clear() @ 
>>> a 

[] 

>>> b 


[45, 43, 32, 21] 

9 a = 3 22 21 321 

>>> a.count (32) @ 

名 

>>> student_list = [" 张 三 "，'" 李 四 '"， ' 王 五 '] 
>>> student list.index(' 王 五 ') ©@ 
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>>> student_tuple = (' 张 三 '，' 李 四 '，' 王 五 ') 
>>> student_ tuple.index(' 王 五 ') 


>>> student_tuple.index(' 李 四 '，1 ，2) 
工 


上 述 代码 中 第 四 行 调用 了 reverse0 方法 将 列表 a 倒置 。 代 码 第 @ 行 调用 copy0 方法 复制 
a， 并 赋值 给 b。 代 码 第 @@ 行 是 清除 a 中 元 素 。 代 码 第 @ 行 是 返回 a 列表 中 32 元 素 的 个 数 。 代 
码 第 回 行 是 返回 ' 王 五 ' 在 student list 列表 中 的 位 置 。 代 码 第 @ 行 是 返回 ' 王 五 ' 在 student_ 
tuple 元 组 中 的 位 置 。 


9.2.7 ”列表 推导 式 


Python 中 有 一 种 特殊 表达 式 一 一 推导 式 ， 它 可 以 将 一 种 数据 结构 作为 输入 ， 经 过 过 滤 、 计 
算 等 处 理 ， 最 后 输出 另 一 种 数据 结构 。 根 据 数 据 结构 的 不 同 可 分 为 列表 推导 式 、 集 合 推 导 式 和 
字典 推导 式 。 本 节 先 介绍 列表 推导 式 。 

如 果 想 获得 0~9 中 偶数 的 平方 数列 ， 可 以 通过 for 循环 实现 ， 代 码 如 下 : 

# coding=utf-8 

# 代码 文件 :chapter9/ch9.2.7.py 


n list = [] 
for x in range(10): 
if 2 == 0: 
n_list.append(x ** 2) 
print(n list) 


输出 结果 如 下 : 


[0, 4, 16, 36, 64] 


0~9 中 偶数 的 平方 数列 也 可 以 通过 列表 推导 式 实现 ， 代 码 如 下 : 


n_ list = [x ** 2 for x in range(10) if x $2==0] © 


print(n list) 


其 中 代码 第 中 行 就 是 列表 推导 式 ， 输 出 的 结果 与 for 循环 是 一 样 的 。 图 9-3 所 示 是 列表 推 
导 式 语法 结构 ， 其 中 in 后 面 的 表达 式 是 “输入 序列 ”; for 前 面 的 表达 式 是 “输出 表达 式 ”， 它 
的 运算 结果 会 保存 一 个 新 列表 中 ; 站 条 件 语 句 用 来 过 滤 输 入 序列 ， 符 合 条 件 的 才 传 递 给 输出 表 
达 式 ,“ 条 件 语句 ”是 可 以 省 略 的 ， 所 有 元 素 都 传递 给 输出 表达 式 。 


n_list = [x ** 2(for x in range(10)(if x % 2 == 9] 
1 1 1 和 
1 1 1 1 


输出 表达 式 元 素 变量 输入 序列 条 件 语句 
图 9-3 ”列表 推导 式 语法 结构 


条 件 语 句 可 以 包含 多 个 条 件 ， 例 如 找 出 0~99 可 以 被 5 整除 的 偶数 数列 ， 实 现代 码 如 下 。 
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n list = [x for xin range(100) if x % 2 == 0 if x%5== 0] 
print (n_1ist) 


列表 推导 式 的 条 件 语 句 有 两 个 ，ifx%2==0 和 这 x %5==0， 可 见 它们 “与 ”的 关系 。 


9.3 集合 集合 


集合 (set) 是 一 种 可 选 代 的 、 无 序 的 、 不 能 包含 重复 元 素 的 数据 
结构 。 图 9-4 是 一 个 班级 的 集合 ， 其 中 包含 一 些 学 生 ， 这 些 学 生 是 无 @ 
序 的 ， 不 能 通过 序号 访问 ， 而 且 不 能 有 重复 。 © 


提示 : 与 序列 比较 ， 序 列 中 的 元 素 是 有 序 的 ， 可 以 重复 出 现 ， 而 © 


集合 中 的 元 素 是 无 序 的 ， 且 不 能 有 重复 的 元 素 。 序 列强 调 的 是 有 序 ， @ 
集合 强调 的 是 不 重复 。 当 不 考虑 顺序 ， 而 且 没有 重复 的 元 素 时 ， 序 列 
和 集合 可 以 互相 替换 。 

集合 又 分 为 可 变 集合 (seb 和 不 可 变 集合 (frozenseb 。 图 9-4 班级 的 集合 


9.3.1 创建 可 变 集合 


可 变 集合 类 型 是 set， 创 建 可 变 集合 可 以 使 用 set([iterable]) 函数 ， 或 者 用 大 括号 {} 将 元 素 
括 起 来 ， 元 素 之 间 用 逗号 分 隔 。 在 Python Shell 中 运行 示例 代码 如 下 : 


> OO 
>>> a 

(三 和 李 四 凤 “于 斑 4 

>>> = Q@ 
>>> len(a) 

3 

>>> a 

本 

>>> set((20, 10, 50, 40, 30)) @ 
{40, 10, 50, 20, 30} 

>>> b = {} @ 
>>> type (b) 

<class 'dict'> 

>>> b = set() © 
>>> type(b) 


<class 'set'> 


上 述 代码 第 @ 行 是 使 用 大 括号 创建 集合 ， 如 果 元 素 有 重复 的 会 怎样 呢 ? 代 码 第 @ 行 包含 有 
E 复 的 元 素 ， 创 建 时 会 剔除 重复 元 素 。 代 码 第 @ 行 是 使 用 setO) 函数 创建 集合 对 象 。 如 果 要 创 
建 一 个 空 的 集合 则 不 能 使 用 f} 表示 ， 见 代码 第 田 行 ，b 并 不 是 集合 而 是 字典 ， 创 建 空 集合 要 
使 用 空 参数 的 set() 函数 ， 见 代码 第 @ 行 。 


提示 : 要 获得 集合 中 元 素 的 个 数 ， 可 以 使 用 len() 函数 ， 注 意 len() 是 函数 不 是 方法 ， 本 例 
中 len(a) 表达 式 返 回 集合 a 的 元 素 个 数 。 


jh 
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9.3.2 ”修改 可 变 集 合 


可 变 集合 类 似 于 列表 ， 可 变 集合 的 内 容 可 以 被 修改 ， 可 以 向 其 中 插入 和 删除 元 素 。 修 改 可 
变 集合 有 几 个 常用 的 方法 。 

。add(elem): 添加 元 素 ， 如 果 元 素 已 经 存在 ， 则 不 能 添加 ， 不 会 抛 出 错误 ; 

。Iremove(elem): 删除 元 素 ， 如 果 元 素 不 存在 ， 则 抛 出 错误 ; 

"discard(elem): 删除 元 素 ， 如 果 元 素 不 存在 ， 不 会 抛 出 错误 ; 

*。 pop0: 删除 返回 集合 中 任意 一 个 元 素 ， 返 回 值 是 删除 的 元 素 ; 

。clear(): 清除 集合 。 

在 Python Shell 中 运行 示例 代码 如 下 : 


>>> student_set = {' 张 三 ',，' 李 四 '，' 王 五 '} 
>>> student_set.add(' 董 六 ') 
>>> student_set 
1 
>>> student_set.remove(' 李 四 ') 
>>> student set 
人 三 
>>> student_set.remove(' 李 四 ') (0) 
Traceback (most recent call last): 
File "<pyshell#144>", line 1, in <module> 
student_set.remove(' 李 四 ') 
KeyError: ' 李 四) 
>>> student_set.discard(' 李 四 ') @ 
>>> student _ set 
[ 
>>> student_ set.discard(' 王 五 ') 
>>> student_ set 
{' 张 三 '，' 董 六 '} 
>>> student_set.pop () 
: 张 三 ， 
>>> student_set 
{' 董 六 '} 
>>> student_ set.clear() 
>>> student set 
set() 


上 述 代码 第 中行 使 用 remove0 方法 删除 元 素 时 ， 由 于 要 删除 的 ' 李 四 ' 已 经 不 在 集合 中 ， 
所 以 会 抛 出 错误 。 而 同样 是 删除 集合 中 不 存在 的 元 素 ，discard() 方法 不 会 抛 出 错误 ， 见 代码 第 
@ 行 。 

9.3.3 ”遍历 集合 


集合 是 无 序 的 ， 没 有 索引 ， 不 能 通过 下 标 访问 单个 元 素 。 但 可 以 遍历 集合 ， 访 问 集合 每 一 
个 元 素 。 
一 般 使 用 for 循环 遍历 集合 ， 示 例 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter9/ch9.3.3.py 
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student_set = {' 张 三 '，' 李 四 '，，' 王 五 '} 


for item in student set: 


print (item) 


Print ('----------- 只 
for i, item in enumerate(student set): (0) 


print('{0} - {1}'.format(i, item)) 


代码 第 Q@ 行 的 for 循环 中 使 用 了 enumerate() 函数 ， 该 函数 在 9.1.4 节 遍 历 元 组 时 已 经 介绍 
过 了 ， 但 需要 注意 的 是 ， 此 时 变量 i 不 是 索引 ， 只 是 遍历 集合 的 次 数 。 


9.3.4 不 可 变 集合 


不 可 变 集合 类 型 是 frozenset， 创 建 不 可 变 集合 应 使 用 frozenset([iterable]) 函数 ， 不 能 使 用 
大 括号 {}。 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> student_set = frozenset({' 张 三 ',，' 李 四 '，' 王 五 '}) @ 

>>> student set 

frozenset ({' 张 三 '，' 李 四 '，' 王 五 '}) 

>>> type (student set) 

<class 'frozenset'> 

>>> student_set.add(' 董 六 ') @ 

Traceback (most recent call last): 

File "<pyshell#168>", line 1, in <module> 

student_set.add(' 董 六 ') 

AttributeError: 'frozenset' object has no attribute 'add' 

>>> a = (21, 32, 43, 45) 

>>> seta = frozenset (a) @ 

>>> seta 

frozenset ({32, 45, 43, 21}) 


上 述 代 码 第 @ 行 是 创建 不 可 变 集合 ， 人 frozenset() 的 参数 {' 张 三 ', ' 李 四 ', ' 王 五 '} 是 另 一 个 
集合 对 象 ， 因 为 集合 也 是 可 和 迭 代 对 象 ， 可 以 作为 frozenset() 的 参数 。 代 码 第 @ 行 函数 使 用 了 一 
个 元 组 a 作为 frozenset() 的 参数 。 

由 于 创建 的 是 不 变 集合 ， 不 能 被 修改 ， 所 以 试图 修改 会 发 生 错误 ， 见 代码 第 @ 行 ， 使 用 
add() 发 生 了 错误 。 


9.3.5 ”集合 推导 式 
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集合 推导 式 与 列表 推导 式 类 似 ， 区 别 只 是 输出 结果 是 集合 。 修 改 9.2.7 节 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter9/ch9.3.5.py 


n_list = {x for x in range(100) if x %$ 2 == 0 if x%5 -== 0} 


print (n_list) 


输出 结果 如 下 : 


{0, 70, 40, 10, 80, 50, 20, 90, 60, 30} 


由 于 集合 是 不 能 有 重复 元 素 的 ， 集 合 推导 式 输出 的 结果 会 过 滤 掉 重复 的 元 素 ， 示 例 代码 如 下 ; 


3 


n list = [x ** 2 for x in input list] 
print(n list) 


n set = {x ** 2 for x in input_ list} 


print(n set) 


输出 结果 如 下 : 


[4, 9, 4, 16, 25, 36, 36, 36] 
{4, 36, 9, 16, 25} 


上 述 代码 第 @ 行 是 列表 推导 式 ， 代 码 第 @ 行 是 集合 推导 式 ， 从 结果 可 见 没 有 重复 的 元 素 。 


9.4 字典 


字典 (dict) 是 可 和 迭代 的 、 可 变 的 数据 结构 ， 
通过 键 来 访问 元 素 。 字 典 结构 比较 复杂 ， 它 是 由 
两 部 分 视图 构成 的 ， 一 个 是 键 (key) 视图 ， 另 一 
个 是 值 (value) 视图 。 键 视图 不 能 包含 重复 元 素 ， 
而 值 集合 可 以 ， 键 和 值 是 成 对 出 现 的 。 

图 9-5 所 示 是 字典 结构 的 “国家 代号 ”。 键 是 
国家 代号 ， 值 是 国家 。 

提示 : 字典 更 适合 通过 键 快速 访问 值 ， 就 像 
查 英 文字 典 一 样 ， 键 就 是 要 查 的 英文 单词 ， 而 值 
是 英文 单词 的 翻译 和 解释 等 内 容 。 有 的 时 候 ， 一 
个 英文 单词 会 对 应 多 个 翻译 和 解释 ， 这 也 是 与 字 
典 集 合 特性 相对 应 的 。 


键 (key) 视图 值 (value) 视图 


"En 


图 9-5 字典 结构 的 国家 代号 
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9.4.1 创建 字典 

字典 类 型 是 dict， 创 建 字典 可 以 使 用 dict0 函数 ， 或 者 用 大 括号 {} 将 “ 键 : 值 ”对 括 起 来 ， 
“ 键 : 值 ”对 之 间 用 冒号 分 隔 。 

在 Python Shell 中 运行 示例 代码 如 下 : 


>>> dictl = {102: ' 张 三 '，105: ' 李 四 '，109: ' 王 五 '} O 
>>> len(dict1) 

3 

>>> dictl 


{L025 一 载 三 号 5 学风， 095 “ 玉 于 "} 

>>> type (dict1) 

<class "dict'> 

>>> dict1l = {} 

>>> dictl 

{} 

>>> dict({102;' 张 三 '，105:; ， 李 四 '，109: ' 王 五 '}) 
人 025-“ 承 三 57 105: “过 四 "1098 "于 五" 


>y> dictE(((102; 工 张 三 2 (105。 "地 四 ")，1109;、 "于 五 *)}) @ 
{102: ' 张 三 '，105: ， 李 四 '，109: ' 王 五 '} 

55> dioE([(i02, 三 ") (2055 “地 四" (109。* 玉 于 "3)》 四 
{102: ' 张 三 '"，105: ' 李 四 '，109:; ' 王 五 '} 

>>> tl = (102,' 张 三 ') 

>>> t2 = (105,' 李 四 ') 

>>> t3 = (109,，' 王 五 ') 

:1 

>>> dict(t) © 
(1028 * 污 三 105: "地 四 * 1095 “ 王 生 * 

> 

>>> dict (list1) 
(42025 渎 三 "055 “过 四" 1098 * 王 王 * 

55 0Let(21p (L100 V05% 二 9]5 [三 "5 李 四 主 瑟 Y @ 


{32023 “" 渎 三 *; 105: 工 李 四 3109s " 王 于 ? 


上 述 代码 第 @ 行 是 使 用 大 括号 “ 键 : 值 ”对 创建 字典 ， 这 是 最 简单 的 创建 字典 方式 。 创 建 
一 个 空 字典 表达 式 是 {} 。 获 得 字典 长 度 ( 键 值 对 个 数 ) 也 是 使 用 len0 函数 。 

代码 第 @ 行 、 第 @ 行 、 第 @ 行 、 第 @ 行 和 第 @ 行 都 用 dict( 函数 创建 字典 。 代 码 第 @ 行 
dict() 函数 参数 是 另外 一 个 字典 {102: ' 张 三 ', 105: ' 李 四 ', 109: ' 王 五 '}， 使 用 这 种 方式 不 如 直 
接 使 用 大 括号 “ 键 : 值 ”方式 。 代 码 第 @ 行 和 第 @ 行 参数 是 一 个 元 组 ， 这 个 元 组 中 要 包含 三 个 
只 有 两 个 元 素 的 元 组 ， 创 建 过 程 参 考 如 图 9-6。 代 码 第 @ 行 和 第 @ 行 参数 是 一 个 列表 ， 这 个 列 
表 中 包含 三 个 只 有 两 个 元 素 的 元 组 。 

代码 第 @ 行 使 用 了 zip0 函数 ，zip0 函数 将 两 个 可 迭代 对 象 打包 成 元 组 ， 在 创建 字典 时 ， 
可 迭代 对 象 元 组 需要 两 个 可 和 迭代 对 象 ， 第 一 个 是 键 〈[102, 105, 109]D， 第 二 个 是 值 ([' 张 三 ，, 
' 李 四 ',' 王 五 人， 它们 包含 的 元 素 个 数 相 同 ， 并 且 一 一 对 应 。 


注意 : 使 用 dict() 函数 创建 字典 时 还 可 以 使 用 一 种 key=value 形式 参数 ， 语 法 如 下 : 


dict (keyl=value1，key2=value2，key3=value3...) 
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key=value 形式 只 能 创建 键 是 字符 串 类 型 的 字典 ， 使 用 时 需要 省 略 包 庄 字 符 串 的 引号 ( 包 
括 双 引 号 或 单 引号 )。 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> dict(102 = ' 张 三 '"，105 = ' 李 四 '，109 = ' 王 五 ') 

SyntaxError: keyword can't be an expression 

>>> dict('102' =' 张 三 '，'105' = ' 李 四 '，'109' = ' 王 五 ') [@] 
SyntaxError: keyword can't be an expression 

>>> dict (S102 = ' 张 三 "'，S105 = ' 李 四 '，s109 = ' 王 五 ') @ 


{'S102':' 张 三 "，"S105"':' 李 四 "'，"'S109': ' 王 五 '} 


代码 第 四 行 试图 通过 上 述 dict() 函数 创建 键 是 整数 类 型 的 字典 ， 结 果 发 生 了 错误 。 代 码 第 
@@ 行 试图 使 用 字符 串 作 为 键 创建 字典 ， 但 是 该 dict() 函数 需要 省 略 字符 串 键 的 引号 ， 因 此 会 发 
生 错 误 。 需 要 注意 本 例 中 键 是 由 数字 构成 的 字符 串 ， 它 们 很 特殊 ， 如 果 省 略 包 衷 它们 的 引号 ， 
那么 它们 会 被 认为 是 数字 ， 使 用 该 dict() 函数 是 不 允许 的 。 代 码 第 国 行 的 键 在 数字 前 面 加 了 S 
字母 ， 这 样 会 识别 为 字符 串 类 型 。 


元 组 tl (102，" 张 三 ') 


元 组 t 
(102，' 张 三) 〈105，' 李 四 ') 〈109，' 王 五 ') ) 
元 组 2 〈105， We 
创建 字典 
元 组 〈109，' 王 五 ) 
dict(t) 


{102:' 张 三 ' 105:' 李 四 ', 109:' 王 五 '} 
图 9-6 创建 字典 


9.4.2 ”修改 字典 

字典 可 以 被 修改 ， 但 都 是 针对 键 和 值 同 时 操作 ， 修 改 字典 操作 包括 添加 、 蔡 换 和 删除 
i 

在 Python Shell 中 运行 示例 代码 如 下 : 


>22> dioty = 11020 1 张 三 67 2105s “ 李 网 "109: " 王 王 "} 
>>> dict1[109] 


和 主 乱 人 

>>> dictl[110] =' 董 六 ' 

>>> dict1 

{102s “" 卫 三 " 1055 本国 109s “" 主 五 ” 1205 二 和 遭 大 ?和 
>>> dict1[109] =' 张 三 ' 加 
>>> dictl 

ft102: ， 张 三 "'，105: ， 李 四 '，109: ' 张 三 "'，110: ' 董 六 '} 
>>> del dict1[109] @ 


>>> dictl 

{L002 “三 105:. “地 网 "110: 类 六 ?3 
>>> dictl.pop(105) 

下 李 四 [3 


>>> dictl 
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Vo2a “时 三 T1901 入 大 
>>> dictl.pop (105,，' 董 六 ' 
' 董 六 ' 

>>> dict1.popitem() 
(110,，' 董 六 ') 

>>> dict1 

{102: " 张 三 '} 


访问 字典 中 元 素 可 通过 下 标 实现 ， 下 标 参数 是 键 ， 返 回 对 应 的 值 ， 代 码 第 @ 行 中 
dict1[109] 是 取出 字典 dictl 中 键 为 109 的 值 。 字 典 下 标 访问 的 元 素 也 可 以 在 赋值 符号 “=” 左 
边 ， 代 码 第 @ 行 是 给 字典 110 键 赋值 ， 注 意 此 时 字典 dictl 中 没有 110 键 ， 那 么 这 样 的 操作 会 
添加 110: ' 董 六 ' 键 值 对 。 如 果 键 存在 那么 会 替换 对 应 的 值 ， 如 代码 第 @ 行 会 将 键 109 对 应 的 
值 蔡 换 为 ' 张 三 '， 虽 然 此 时 值 视图 中 已 经 有 ' 张 三 ' 了， 但 仍然 可 以 添加 ， 这 说 明 值 是 可 以 重 
复 的。 代码 第 @ 行 是 删除 109 键 对 应 的 值 ， 注 意 del 是 语句 不 是 函数 。 使 用 del 语句 删除 键 值 
对 时 ， 如 果 键 不 存在 会 抛 出 错误 。 

如 果 喜 欢 使 用 一 种 方法 删除 元 素 ， 可 以 使 用 字典 的 pop(key[, default]) 和 popitem() 方法 。 
pop(key[, default]) 方法 删除 键 值 对 时 ， 如 果 键 不 存在 则 返回 默认 值 (defaulb ， 见 代码 第 @@ 行 ， 
105 键 不 存在 返回 默认 值 ' 董 六 '。popitem() 方法 可 以 删除 任意 键 值 对 ， 返 回 删除 的 键 值 对 构 
成 元 组 ， 上 述 代码 第 @ 行 删除 了 一 个 键 值 对 ， 返 回 一 个 元 组 对 象 110,' 董 六 )。 

9.4.3 ”访问 字典 

字典 还 需要 一 些 方法 用 来 访问 它 的 键 或 值 ， 这 些 方 法 如 下 。 

。get(key[, default]): 通过 键 返回 值 ， 如 果 键 不 存在 返回 默认 值 。 

"items0: 返回 字典 的 所 有 键 值 对 。 

"keys0: 返回 字典 键 视图 。 

。，values(): 返回 字典 值 视图 。 

在 Python Shell 中 运行 示例 代码 如 下 : 

So dctl = {102: “家 三 77 1055 “来 四 号 109s "王政" 

>>> dictl.get(105) 

下 李 四 上 

>>> dictl.get (101) 

>>> dictl.get(101，' 董 六 ') 

下 董 六 上 

>>> dict1l.items () 

dict_items([(102，' 张 三 ')，(105， ' 李 四 ')，(109，' 王 五 ')]) 

>>> dictl.keys() 

dict_keys([102, 105, 109]) 

>>> dictl.values() 

dict_values([' 张 三 ',，' 李 四 '，' 王 五 ']) 


上 述 代码 第 外 行 通过 get0 方法 返回 105 键 对 应 的 值 ， 如 果 没有 键 对 应 的 值 ， 而 且 还 没有 
为 get0 方法 提供 默认 值 ， 则 不 会 有 返回 值 ， 见 代码 第 @ 行 。 代 码 第 @@ 行 提供 了 返回 值 。 

在 访问 字典 时 ， 也 可 以 使 用 in 和 not in 运算 符 ， 但 需要 注意 的 是 ，in 和 not in 运算 符 只 在 
测试 键 视图 中 进行 。 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> student dict = {"102*:“* 张 三 *，"105";'" 李 四 "，"109': " 王 五 '")} 


@ 
@ 
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>>> 102 in dictl 
True 
>>> ' 李 四 ' in dictl 


False 


9.4.4 ”遍历 字典 


字典 遍历 也 是 字典 的 重要 操作 。 与 集合 不 同 ， 字 典 有 两 个 视图 ， 因 此 遍历 过 程 可 以 只 遍历 
值 视 图 ， 也 可 以 只 遍历 键 视图 ， 也 可 以 同时 遍历 。 这 些 遍 历 过程 都 是 通过 for 循环 实现 的 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 chapter9/ch9.4.4.py 


student_ dict = {102: ' 张 三 '"，105:' 李 四 '，109: ' 王 五 '} 


print ('--- 遍历 键 ---') 
for student id in student dict.keys(): O 
print(' 学 号 : ' + str(student_id)) 


print('--- 遍历 值 ---') 
for student name in student dict.values(): @ 


print (' 学 生 : ' + student name) 


print ('--- 遍历 键 : 值 ---') 
for student_ id, student name in student dict.items(): @ 
print (' 学 号 ，{0} - 学 生 : {1}'.format (student_id, student name)) 


输出 结果 如 下 : 


--- 遍历 键 --- 

学 号 : 102 

学 号 : 105 

学 号 : 109 

--- 遍历 值 --- 

学 生 : 张 三 

学 生 : 李 四 

学 生 : 王 五 

--- 遍历 键 : 值 --- 
学 号 : 102 - 学 生 : 张 三 
学 号 : 105 - 学 生 : 李 四 
学 号 : 109 - 学 生 : 王 五 


上 述 代 码 第 图 行 遍历 字典 的 键 值 对 ，items() 方 法 返回 键 值 对 元 组 序列 ，student id, 
student name 是 从 元 组 拆 包 出 来 的 两 个 变量 。 


9.4.5 字典 推导 式 
因为 字典 包含 了 键 和 值 两 个 不 同 的 结构 ， 因 此 字典 推导 式 结果 可 以 非常 灵活 。 字 典 推导 示 
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例 代码 如 下 : 
# coding=utf-8 
# 代码 文件 : chapter9/ch9.4.5.py 


input dict = {'one': 1, 'two': 2, 'three': 3, 'four': 4} 


output dict = {k: v for k, v in input dict.items() if v% 2 == 0} (0) 
print (output_dict) 


keys = [k for k, v in input dict.items() if vs 2 == 0] @ 
print (keys) 


输出 结果 如 下 : 


Cb 

['two', 'four'] 

上 述 代 码 第 四 行 是 字典 推导 式 ， 注 意 输入 结构 不 能 直接 使 用 字典 ， 因 为 字典 不 是 序列 ， 
可 以 通过 字典 的 item() 方法 返回 字典 中 键 值 对 序列 。 代 码 第 @ 行 是 字典 推导 式 ， 但 只 返回 键 
结构 。 


本 章 小 结 


本 章 介绍 了 Python 中 的 几 种 数据 结构 。 其 中 包括 序列 、 元 组 、 集 合 和 字典 ， 读 者 应 了 解 
序列 的 特点 ， 清 楚 序 列 包 括 哪些 结构 。 然 后 详细 介绍 了 元 组 、 集 合 和 字典 。 


电 


程序 中 反复 执行 的 代码 可 以 封装 到 一 个 代码 块 中 ， 这 个 代码 块 模仿 了 数学 中 的 函数 ， 具 有 
函数 名 、 参 数 和 返回 值 ， 这 就 是 程序 中 的 函数 。 

Python 中 的 函数 很 灵活 ， 它 可 以 在 模块 中 、 但 是 在 类 之 外 定义 ， 即 函数 ， 其 作用 域 是 当前 
模块 ， 也 可 以 在 别 的 函数 中 定义 ， 即 幅 套 函数 ;还 可 以 在 类 中 定义 ， 即 方法 。 


10.1 定义 函数 
在 前 面 的 学 习 过 程 中 用 到 了 一 些 函数 ， 如 len0、min(0 和 max(0， 这 些 函 数 都 是 由 Python 
官方 提供 的 ， 称 为 内 置 函 数 (Built-in Functions, BIF) 。 中 
加 
注意 : Python 作为 解释 性 语言 ， 其 函数 必须 先 定 义 后 调用 ， 也 就 是 定义 函数 必须 在 调 要 码 
用 函数 之 前 ， 否 则 会 发 生 错误 。 


本 节 介 绍 自 定义 函数 ， 自 定义 函数 的 语法 格式 如 下 : 
def 函数 名 ( 参数 列表 ) : 
函数 体 
return 返回 值 
在 Python 中 定义 函数 时 ， 关 键 字 是 def， 函 数 名 需要 符合 标识 符 命名 规范 。 多 个 参数 列表 
之 间 可 以 用 逗号 “ ,” 分 隔 ， 当 然 函数 也 可 以 没有 参数 。 如 果 函 数 有 返回 数据 ， 就 需要 在 函数 
体 最 后 使 用 return 语句 将 数据 返回 ， 如 果 没有 返回 数据 ， 则 函数 体 中 可 以 使 用 return None 或 
省 略 return 语句 。 
函数 定义 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapterl0/ch10.1.py 


def rectangle area(width, height): 
area = width * height 
return area 


r_area = rectangle area(320.0, 480.0) 加 


print ("320X480 的 长 方形 的 面积 :{0: .2f}".format (r_area)) 
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上 述 代码 第 @@ 行 是 定义 计算 长 方形 面积 的 函数 rectangle_area， 它 有 两 个 参数 ， 分 别 是 长 
方形 的 宽 和 高 ，width 和 height 是 参数 名 。 代 码 第 @ 行 代码 通过 return 返回 函数 计算 结果 。 代 
码 第 @ 行 调用 了 rectangle_area 函数 。 


10.2 ”函数 参数 


Python 中 的 函数 参数 很 灵活 ， 具 体 体现 在 传递 参数 有 多 种 形式 上 。 本 节 介绍 几 种 不 同形 式 
的 参数 和 调用 方式 。 


10.2.1 使 用 关键 字 参 数 调 用 函数 


为 了 提高 函数 调用 的 可 读 性 ， 在 函数 调用 时 可 以 使 用 关键 字 参 数 调用 。 采 用 关键 字 参 数 调 
用 函数 ， 在 函数 定义 时 不 需要 做 额外 的 工作 。 

示例 代码 如 下 : 

# coding=utf-8 

# 代码 文件 : chapter1l0/ch10.2.1.py 


def print areal(width, height): 
area = width * height 
print ("{0} x {1} 长 方形 的 面积 :{2}".format (width, height, area)) 


print_area(320.0, 480.0) # 没有 采用 关键 字 参 数 函 数 调用 © 
print_area (width=320.0, height=480.0) # 采用 关键 字 参 数 函 数 调用 @ 
print_area(320.0, height=480.0) # 采用 关键 字 参 数 函 数 调用 @ 
# print area(width=320.0, height) # 发 生 错误 四 
print_area (height=480.0, width=320.0) # 采用 关键 字 参 数 函 数 调用 © 


print_area 函数 有 两 个 参数 ， 在 调用 时 没有 采用 关键 字 参 数 函数 调用 的 情形 见 代 码 第 四 行 ， 
也 可 以 使 用 关键 字 参 数 调用 函数 ， 见 代码 第 @ 行 、 第 @ 行 和 第 @ 行 ， 其 中 width 和 height 是 参 
数 名 。 从 上 述 代码 比较 可 见 ， 采 用 关键 字 参 数 调 用 函数 ， 调 用 者 能 够 清晰 地 看 出 传递 参数 的 含 
义 ， 关 键 字 参数 对 于 有 多 个 参数 的 函数 调用 非常 有 用 。 另 外 ， 采 用 关键 字 参 数 函 数 调用 时 ， 参 
数 顺序 可 以 与 函数 定义 时 的 参数 顺序 不 同 。 


注意 : 在 调用 函数 时 ， 一 旦 其 中 一 个 参数 采用 了 关键 字 参 数 形 式 传递 ， 那 么 其 后 的 所 有 参 
数 都 必须 采用 关键 字 参 数 形 式 传 递 。 代 码 第 图 行 的 函数 调用 中 ， 第 一 个 参数 width 采用 了 关键 
字 参 数 形 式 ， 而 它 后 面 的 参数 没有 采用 关键 字 参 数 形式 ， 因 此 会 有 错误 发 生 。 


10.2.2 ”参数 默认 值 


在 定义 函数 的 时 候 可 以 为 参数 设置 一 个 默认 值 ， 调 用 函数 时 可 以 忽略 该 参数 。 来 看 下 面 的 
一 个 示例 : 


# coding=utf-8 
# 代码 文件 : chapter9/ch10.2.2.py 
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def make_coffee (name=" 卡 布 奇 诺 ") : 
return "制作 一 杯 {0} 咖啡 。" . format (name) 


上 述 代码 定义 了 makeCoffee 函数 ， 其 中 把 卡 布 奇 诺 设置 为 了 默认 值 。 在 参数 列表 中 ， 默 


认 值 可 以 跟 在 参数 类 型 的 后 面 ， 通 过 等 号 提供 给 参数 。 在 调用 的 时 候 ， 如 果 调用 者 没有 传递 参 
数 ， 则 使 用 默认 值 。 调 用 代码 如 下 : 


coffeel = make_coffee(" 拿 铁 ") O 
coffee2 = make coffee() © 
print (coffeel) # 制作 一 杯 拿 铁 咖啡 。 

print (coffee2) # 制作 一 杯 卡 布 奇 诺 咖啡 。 


其 中 第 @ 行 代码 是 传递 " 拿 铁 " 参数 ， 没 有 使 用 默认 值 。 第 @ 行 代码 没有 传递 参数 ， 因 此 
使 用 默认 值 。 


提示 : 在 Java 语言 中 make_coffee 函数 可 以 采用 重 载 实 现 多 个 版 本 。Python 不 支持 函数 
重 载 ， 而 是 使 用 参数 默认 值 的 方式 提供 类 似 函 数 重 载 的 功能 。 因 为 参数 默认 值 只 需要 定义 一 个 
函数 就 可 以 了 ， 而 重 载 则 需要 定义 多 个 函数 ， 这 会 增加 代码 量 。 


10.2.3 ”可 变 参 数 


Python 中 函数 的 参数 个 数 可 以 变化 ， 它 可 以 接受 不 确定 数量 的 参数 ， 这 种 参数 称 为 可 变 参 
数 。Python 中 可 变 参数 有 两 种 ， 即 参数 前 加 * 或 ** 形式 ，* 可 变 参数 在 函数 中 被 组 装 成 为 一 
个 元 组 ，** 可 变 参数 在 函数 中 被 组 装 成 为 一 个 字典 。 

1. “可 变 参数 

下 面 看 一 个 示例 : 

def sum(*numbers, multiple=1): 


total = 0.0 
for number in numbers: 


total += number 
return total * multiple 


上 述 代 码 定义 了 一 个 sum() 函数 ， 用 来 计算 传递 给 它 的 所 有 参数 之 和 。*numbers 是 可 变 参 
数 。 在 函数 体 中 参数 numbers 被 组 装 成 为 一 个 元 组 ， 可 以 使 用 for 循环 遍历 numbers 元 组 ， 计 
算 它们 的 总 和 ， 然 后 返回 给 调用 者 。 

下 面 是 三 次 调用 sum() 函数 的 代码 。 


print (sum(100.0, 20.0, 30.0)) # 输出 150.0 
print (sum(30.0, 80.0)) # 输出 110.0 
print (sum(30.0, 80.0, multiple=2)) # 输出 220.0 [Oo 
double tuple = (50.0, 60.0, 0.0) # 元 组 或 列表 © 
print (sum(30.0, 80.0, *double tuple)) # 输出 220.0 @ 


可 以 看 到 ， 每 次 所 传递 参数 的 个 数 是 不 同 的 ， 前 两 次 调用 时 都 省 略 了 multiple 参数 ， 第 
三 次 调用 时 传递 了 multiple 参数 ， 此 时 multiple 应 该 使 用 关键 字 参 数 传递 ， 否 则 有 错误 发 生 。 
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如 果 已 经 有 一 个 元 组 变量 ( 见 代 码 第 @ 行 )， 能 否 传递 给 可 变 参 数 呢 ?” 这 需要 对 元 组 进行 拆 
包 ， 见 代码 第 @ 行 ， 在 元 组 double_tuple 前 面 加 上 单 星 号 “* ”， 单 星 号 在 这 里 表示 将 double_ 
tuple 拆 包 为 50.0, 60.0, 0.0 形式 。 另 外 ，double tuple 也 可 以 是 列表 对 象 。 

注意 : * 可 变 参 数 不 是 最 后 一 个 参数 时 ,后面 的 参数 需要 采用 关键 字 参 数 形式 传递 。 代 码 
第 (上行 30.0, 80.0 是 可 变 参 数 ， 后 面 multiple 参数 需要 关键 字 参 数 形 式 传递 。 


2. 六 可 变 参数 
下 面 看 一 个 示例 : 


def show info(sep="':', **info): 


for key, value in info.items(): 


print('{0} {2} {1}'.format (key, value, sep)) 


上 述 代码 定义 了 一 个 show_info0 函数 ， 用 来 输出 一 些 信息 ， 其 中 参数 sep 为 信息 分 隔 符 
号 ， 默 认 值 是 冒号 “:”。#*info 是 可 变 参 数 ， 在 函数 体 中 参数 info 被 组 装 成 为 一 个 字典 。 

注意 : ** 可 变 参 数 必 须 在 正规 参数 之 后 ， 如 果 本 例 函 数 定 义 改 为 show_info(**info， 
Sep=':") 形式 ， 会 发 生 错误 。 


下 面 是 三 次 调用 show_info0 函数 的 代码 。 


show_info('->', name='Tony', age=18, sex=True) O 
show_info(sutdent name='Tony', sutdent no='1000', sep="'-') 加 
stu dict = {'name': 'Tony', 'age': 18} # 创建 字典 对 象 

show_info(**stu dict, sex=True, sep='="') # 传递 字典 stu_dict @ 


上 述 代码 第 四 行 是 调用 函数 show_info0， 第 一 个 参数 '->' 传 递 给 sep， 其 后 的 参数 
name='Tony', age=18, sex=True 传递 给 info， 这 种 参数 形式 事实 上 就 是 关键 字 参 数 ， 注 意 键 不 
要 用 引号 括 起 来 。 

代码 第 @ 行 是 调用 函数 show_info()，sep 也 采用 关键 字 参 数 传递 ， 这 种 方式 下 sep 参数 可 
以 放置 在 参数 列表 的 任何 位 置 ， 其 中 的 关键 字 参 数 被 收集 到 info 字典 中 。 

代码 第 @ 行 是 调用 函数 show_info()， 其 中 字典 对 象 为 stu_dict， 传 递 时 stu_dict 前 面 加 上 
双星 号 “**” 双星 号 在 这 里 表示 将 stu_dict 拆 包 为 key=value 对 的 形式 。 


10.3 ”函数 返回 值 


Python 函数 的 返回 值 也 是 比较 灵活 的 ， 主 要 有 三 种 形式 : 无 返回 值 、 单 一 返回 值 和 多 返回 
加 值 。 前 面 使 用 的 函数 基本 都 是 单一 返回 值 ， 本 节 重 点 介绍 无 返回 值 和 多 返回 值 两 种 形式 。 


10.3.1 无 返回 值 函 数 


有 的 函数 只 是 为 了 处 理 某 个 过 程 ， 此 时 可 以 将 函数 设计 为 无 返回 值 的 。 所 谓 无 返回 值 ， 事 
实 上 是 返回 None，None 表示 没有 实际 意义 的 数据 。 
无 返回 值 函 数 示 例 代码 如 下 。 


# coding=utf-8 
# 代码 文件 chapter9/ch10.3.1.py 


def show info(sep=':', **info0): 
""" 定义 ** 可 变 参 数 函数 """ 
print('----- info------ 号 


for key, value in info.items(): 
print('{0} {2} {1}'.format (key, value, sep)) 
return # return None 或 省 略 


result = show info('->', name='Tony', age=18, sex=True) 


print (result) # 输出 None 


def sum(*numbers, multiple=1): 
""" 定义 * 可 变 参数 函数 """ 
if len(numbers) == 0: 
return # return None 或 省 略 
total = 0.0 
for number in numbers: 
total += number 
return total * multiple 


print (sum(30.0, 80.0)) # 输出 110.0 
print (sum (multiple=2)) # 输出 None 
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上 述 代 码 定 义 了 两 个 函数 ， 这 两 个 函数 事实 上 是 在 10.3.2 节 示 例 基础 上 的 重 构 。 其 中 代码 


第 @@ 行 的 show_info0 只 是 输出 一 些 信 息 ， 不 需要 返回 数据 ， 因 此 可 以 省 略 return 语句 。 如 果 
一 定 要 使 用 return 语句 ， 见 代码 第 @ 行 在 函数 结束 前 使 用 return 或 return None 的 方式 。 


对 于 本 例 中 的 show_info0 函数 强加 return 语句 显然 是 多 此 一 举 ， 但 是 有 时 使 用 return 或 


10.3.2 ”多 返回 值 函 数 


return None 是 必要 的 。 代 码 第 @ 行 定义 了 sum() 函数 ， 如 果 numbers 中 数据 是 空 的 ， 后 面 的 求 
和 计算 也 就 没有 意义 了 ， 可 以 在 函数 的 开始 判断 numbers 中 是 否 有 数据 ， 如 果 没 有 数据 则 使 用 
return 或 return None 跳出 函数 ， 见 代码 第 @ 行 。 


有 时 需要 函数 返回 多 个 值 ， 实 现 返回 多 个 值 的 方式 有 很 多 ， 简 单 的 方式 是 使 用 元 组 返回 多 


下 面 来 看 一 个 示例 : 


# coding=utf-8 
# 代码 文件 ， chapter9/ch10.3.2.py 


def position(dt, speed): 
posx = speed[0] * dt 
posy = speed[1] * dt 


个 值 ， 因 为 元 组 作为 数据 结构 可 以 容纳 多 个 数据 ， 另 外 元 组 是 不 可 变 的 ， 使 用 起 来 比较 安全 。 


@@e 
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return (posx, posy) @ 


move = position(60.0, (10, -5)) 加 


print (" 物体 位 移 ，({01，{1})".format (move[0]，move[1])) 


这 个 示例 是 计算 物体 在 指定 时 间 和 速度 时 的 位 移 。 第 @ 行 代码 是 定义 position 函数 ， 其 中 
dt 参数 是 时 间 ，speed 参数 是 元 组 类 型 ，speed 第 一 个 元 素 是 义 轴 上 的 速度 ，speed 第 二 个 元 素 
是 Y 轴 上 的 速度 。position 函数 的 返回 值 也 是 元 组 类 型 。 

函数 体 中 的 第 @ 行 代码 是 计算 X 方 向 的 位 黎 ， 第 @ 行 代码 是 计算 Y 方 向 的 位 移 。 最 后 ， 
第 @ 行 代码 将 计算 后 的 数据 返回 ，(posx, posy) 是 元 组 类 型 实例 。 

第 @ 行 代码 调用 函数 ， 传 递 的 时 间 是 60.0 秒 ， 速 度 是 (10, -5)。 第 @ 行 代码 打印 输出 结 
果 ， 结 果 如 下 : 


物体 位 移 ，(600.0，-300.0) 


10.4 函数 变量 作用 域 


变量 可 以 在 模块 中 创建 ， 其 作用 域 是 整个 模块 ， 称 为 全 局 变量 。 变 量 也 可 以 在 函数 中 创 
默认 情况 下 其 作用 域 是 整个 函数 ， 称 为 局 部 变量 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter9/ch10.4.py 


# 创建 全 局 变量 x 
无: 己 2 © 


def print value(): 
print(" 函数 中 x = {0}".format (x)) @ 


print_ value() 
print (" 全 局 变量 x = {0}".format (x)) 


输出 结果 : 
函数 中 x = 20 
全 局 变量 x = 20 


上 述 代码 第 四 行 是 创建 全 局 变量 x， 全 局 变量 作用 域 是 整个 模块 ， 所 以 在 print_value() 函 
数 中 也 可 以 访问 变量 x， 见 代码 第 @ 行 。 

修改 上 述 示例 代码 如 下 : 

# 创建 全 局 变量 x 


EA 


def print value(): 
# 创建 局 部 变量 x 
x= 10 © 
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print (" 函数 中 x = {0}".format (x)) 


print value() 


print (" 全 局 变量 x = {0}".format (x)) 


输出 结果 : 


函数 中 x = 10 
全 局 变量 x = 20 


上 述 代码 在 print_value() 函数 中 添加 了 x = 10 语句 ， 见 代码 第 @ 行 ， 函 数 中 的 x 变量 与 全 
局 变量 x 命名 相同 ， 在 函数 作用 域内 会 屏蔽 全 局 xx 变量。 

函数 中 创建 的 变量 默认 作用 域 是 当前 函数 ， 这 可 以 让 程序 员 少 犯错 误 ， 因 为 函数 中 创建 的 变 
量 ， 如 果 作用 域 是 整个 模块 ， 那 么 在 其 他 函数 中 也 可 以 访问 ，Python 无 法 从 语言 层面 定义 常量 ， 
所 以 在 其 他 函数 中 可 能 会 由 于 误 操 作 修改 了 变量 ， 这 样 一 来 很 容易 导致 程序 出 现 错误 。 但 Python 
提供 这 种 功能 ， 即 在 函数 中 将 变量 声明 为 global， 这 样 就 可 以 把 变量 的 作用 域 变 成 全 局 的 。 

修改 上 述 示例 代码 如 下 : 


# 创建 全 局 变量 x 
X = 20 


def print value(): 
global x 
溉 "= 六 和 
print (" 函数 中 x = {0}".format (x)) 


@e 


print_value() 
print (" 全 局 变量 x = {0}".format (x)) 


输出 结果 : 
函数 中 x = 10 
全 局 变量 x = 10 


代码 第 @ 行 是 在 函数 中 声明 x 变量 的 作用 域 为 全 局 变量 ， 所 以 代码 第 @ 行 修改 x 值 就 是 修 
改 全 局 变量 x 的 数值 。 


10.5 生成 器 


在 一 个 函数 中 经 常 使 用 return 关键 字 返 回 数据 ， 但 是 有 时 候 会 使 用 yield 关键 字 返 回 数据 。 国 8 
使 用 yield 关键 字 的 函数 返回 的 是 一 个 生成 器 (generator) 对 象 ， 生 成 器 对 象 是 一 种 可 迭代 对 象 。 
例如 计算 平方 数列 ， 通 常 的 实现 代码 如 下 : 


def square (num) : © 
mn 1iast = 人 


扫 码 看 视频 


for i in range(1，num + 1) : 


n_list.append (i * i) 


return n list 
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for i in square(5) : 图 


print (i，end=， ') 


返回 结果 : 


14916 25 


首先 定义 一 个 函数 ， 见 代码 第 @ 行 。 代 码 第 @ 行 通过 循环 计算 一 个 数 的 平方 ， 并 将 结果 保 
存 到 一 个 列表 对 象 n_list 中 。 最 后 返回 列表 对 象 ， 见 代码 第 @ 行 。 代 码 第 @ 行 是 遍历 返回 的 列 
表 对 象 。 

在 Python 中 还 可 以 有 更 好 的 解决 方案 ,实现 代码 如 下 : 


def square (num) : 


for i in range(1，num + 1) : 
yield 斌 * @ 


for i in square(5) : @ 
print(i，end=' ') 


返回 结果 : 


149 16 25 


代码 第 四 行使 用 了 yield 关键 字 返 回 平方 数 ， 不 再 需要 return 关键 字 了 。 代 码 第 @ 行 调用 
函数 square0 返回 的 是 生成 器 对 象 。 生 成 器 对 象 是 一 种 可 和 迭代 对 象 ， 可 和 迭代 对 象 通过 _next_0 
方法 获得 元 素 ， 代 码 第 @ 行 的 for 循环 能 够 遍历 可 迭代 对 象 ， 就 是 隐 式 地 调用 了 生成 器 的 
_ next_() 方法 获得 元 素 的 。 

显 式 地 调用 生成 器 的 _next_() 方法， 在 Python Shell 中 运行 示例 代码 如 下 : 


>>> def square (num) : 


for i in range(1，num + 1) : 
yield i * 工 


>>> n_seq = square(5) 

<generator object square at 0x000001C8F123CE60> 
>>> n_seq._next () @ 
工 

>>> n_seq._next_() 

4 

>>> n_seq._next_() 


9 
>>> n_seq._next_() 
16 
>>> n_seq._ next () 
25 


>>> n_seq._ next () @ 
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Traceback (most recent call last): 
File "<pyshell#33>", line 1, in <module> 


n_seq._next () 


StopIteration 

>>> 

上 述 代码 第 四 行 和 第 @ 行 共 调用 了 6 次 _next_() 
方法 ， 但 第 6 次 调用 会 抛 出 StopIteration 异常 ， 这 是 因 rr-------+i-------- 循环 
为 已 经 没有 元 素 可 迭代 了 。 yield 语 句 


生成 器 函数 通过 yield 返回 数据 ， 与 return 不 同 的 返回 数据 并 暂停 


是 ，returm 语句 一 次 返回 所 有 数据 ， 函 数 调 用 结束 而 
yield 语句 只 返回 一 个 元 素数 据 ， 函 数 调用 不 会 结束 ， 只 
是 暂停 ， 直 到 _next_() 方 法 被 调用 ， 程 序 继续 执行 
yield 语句 之 后 的 语句 代码 。 这 个 过 程 如 图 10-1 所 示 。 
注意 : 生成 器 特别 适合 用 于 遍历 一 些 大 序列 对 象 ， 一- 十 -一 
它 无 须 将 对 象 的 所 有 元 素 都 载 入 内 存 后 才 开始 进行 操 
作 ， 仅 在 迭代 至 某 个 元 素 时 才 会 将 该 元 素 载 入 内 存 。 


等 到 _next_() 方 法 
被 调用 则 继续 执行 


图 10-1 生成 器 函数 执行 过 程 


10.6 ”区 套 函数 


在 本 节 之 前 定义 的 函数 都 是 全 局 函数 ， 并 将 它们 定义 在 全 局 作用 域 中 。 函 数 还 可 定义 在 另 
外 的 函数 体 中 ， 称 作 “ 嵌 套 函数 ”。 
示例 代码 : 


# coding=utf-8 
# 代码 文件 :chapterl0/ch10.6.py 


def calculate(nl, n2, opr): 
multiple = 2 


# 定义 相 加 函数 
def add(a, b): O 
return (a + b) * multiple 


# 定义 相 减 函数 
def subla, b): @ 


return (a - b) * multiple 


if Opr == “+": 
return add(n1，n2) 
else: 


return sub (n1，n2) 


print (calculate (10, 5, '+')) # 输出 结果 是 30 
# add(10，5) 发 生 错误 
# sub(10，5) ”发 生 错 误 


@ 四 
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上 述 代码 中 定义 了 两 个 嵌 套 函数 add() 和 sub0， 见 代码 第 中行 和 第 @ 行 。 藤 套 函 数 可 以 访 
问 所 在 外 部 函数 calculate() 中 的 变量 multiple， 而 外 部 函数 不 能 访问 檬 套 函 数 局 部 变量 。 另 外 ， 
嵌 套 函数 的 作用 域 在 外 部 函数 体内 ， 因 此 在 外 部 函数 体 之 外 直接 访问 符 套 函数 会 发 生 错误 ， 见 
代码 第 @ 行 和 第 @ 行 。 


10.7 ”函数 式 编程 基础 


函数 式 编程 (functional programming) 与 面向 对 象 编程 一 样 都 是 一 种 编程 范式 ， 函 数 式 编 
i 程 也 称 为 面向 函数 的 编程 。 

Python 并 不 是 彻底 的 函数 式 编程 语言 ， 但 还 是 提供 了 一 些 函 数 式 编程 必 备 的 技术 ， 主 要 有 
函数 类 型 和 Lambda 表达 式 ， 它 们 是 实现 函数 式 编程 的 基础 。 


10.7.1 函数 类 型 


Python 提供 了 一 种 函数 类 型 function， 任 何 一 个 函数 都 有 函数 类 型 ， 函 数 调用 时 ， 就 创建 
了 函数 类 型 实例 ， 即 函数 对 象 。 函 数 类 型 实例 与 其 他 类 型 实例 一 样 ， 在 使 用 场景 上 没有 区 别 ， 
它 可 以 赋值 给 一 个 变量 ， 也 可 以 作为 参数 传递 给 一 个 函数 ， 还 可 以 作为 函数 返回 值 使 用 。 

为 了 理解 函数 类 型 ， 先 重 构 10.6 节 中 嵌 套 函数 的 示例 ， 示 例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl0/ch10.7.1.py 


def calculate_fun (opr) : O 
# 定义 相 加 函数 
def add(a，b) : 
Feturn a + b 


# 定义 相 减 函数 
def sub(a，b) : 
return 二 -二 了 


if opr == "+": 
return add @ 
else: 
return sub @ 
= calculate_ fun('+') @ 
2 = calculate fun('-') © 
print (type (£1)) 
print("10 + 5 = {0}".format (f1(10, 5))) © 
print("10 - 5 = {0}".format (£2(10, 5))) @ 


输出 结果 : 


<class "function'> 
10 + 5 三 30 
10-5= 10 
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上 述 代 码 第 @ 行 重 构 了 calculate_fun() 函数 的 定义 ， 现 在 只 接收 一 个 参数 opr。 代 码 第 @ 
行 在 opr == + 为 True 时 返回 add 函数 名 ， 否则 返回 sub 函数 名 ， 见 代码 第 @ 行 。 这 里 的 函 
数 名 本 质 上 为 函数 对 象 。calculate_fun() 函数 与 10.5 节 示 例 的 calculate() 函数 不 同 之 处 在 于 ， 
calculate_fun() 函数 返回 的 是 函数 对 象 ，calculate() 函数 返回 的 是 整数 〈 相 加 或 相 减 计算 之 后 的 
结果 ) 。 所 以 代码 第 @ 行 的 亿 是 add0 函数 对 象 ， 代 码 第 @ 行 的 亿 是 sub() 函数 对 象 。 

函数 对 象 是 可 以 与 函数 一 样 进行 调用 的 。 事 实 上 在 第 @ 行 之 前 没有 真正 调用 add() 函数 进 
行 相 加 计算 ,人 (10, 5) 表达 式 才 真 调用 了 add() 函数 。 第 @ 行 的 亿 (10, 5) 表达 式 调用 了 sub() 
函数 。 


10.7.2 ”Lambda 表达 式 


理解 了 函数 类 型 和 函数 对 象 ， 学 习 Lambda 表达 式 就 简单 了 。Lambda 表达 式 本 质 上 是 一 
种 匿名 函数 ， 匿 名 函数 也 是 函数 ， 有 函数 类 型 ， 也 可 以 创建 函数 对 象 。 
定义 Lambda 表达 式 语 法 如 下 : 


lambda 参数 列表 : Lambda 体 


lambda 是 关键 字 声 明 ， 这 是 一 个 Lambda 表达 式 ,“ 参 数列 表 ” 与 函数 的 参数 列表 是 一 样 
的 ， 但 不 需要 小 括号 括 起 来 ， 冒 号 后 面 是 “Lambda 体 ”，Lambda 表达 式 的 主要 代码 在 此 处 编 
写 ， 类 似 于 函数 体 。 


注意 : Lambda 体 部 分 不 能 是 一 个 代码 块 ， 不 能 包含 多 条 语句 ， 只 能 有 一 条 语句 ， 语 句 会 
计算 一 个 结果 返回 给 Lambda 表达 式 ， 但 是 与 函数 不 同 的 是 ， 不 需要 使 用 return 语句 返回 。 与 
其 他 语言 中 的 Lambda 表达 式 相 比 ,Python 中 提供 的 Lambda 表达 式 只 能 处 理 一 些 简单 的 计算 。 


重 构 10.7.1 节 示 例 ， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 chapterl0/ch10.7.2.py 


def calculate_ fun (opr) : 
if opr == "+': 
return lambda a, b: (a + b) 
else: 
return lambda a, b: (a - b) 


m 
PP 


= calculate fun('+') 


[x 


= calculate fun('-') 
print (type (£1)) 


print ("10 + 5 
print("10 - 5 


输出 结果 : 


<class "function'"> 
10 十 5 30 
320 -5 10 


{0}".format (f1(10, 5))) 
{0}".format (£2(10, 5))) 
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上 述 代码 第 @ 行 蔡 代 了 add0 函数 ， 第 @ 行 苦 代 了 sub() 函数 ， 代 码 变 得 非常 简单 。 


10.7.3 ”三 大 基础 函数 


函数 式 编程 的 本 质 是 通过 函数 处 理 数据 ， 过 滤 、 映 射 和 聚合 是 处 理 数据 的 三 大 基本 操作 。 
针对 其 中 三 大 基本 操作 ，Python 提供 了 三 个 基础 的 函数 : filter)、mapO 和 reduce()。 

1. filter() 

过 滤 操作 使 用 filter0 函数 ， 它 可 以 对 可 和 迭代 对 象 的 元 素 进行 过 滤 ，filter0 函数 语法 如 下 


filter (function, iterable) 


其 中 参数 function 是 一 个 函数 ， 参 数 iterable 是 可 和 迭代 对 象 。filter0 函数 调用 时 iterable 会 被 
遍历 ， 它 的 元 素 被 逐一 传 入 function 函数 ，function 函数 返回 布尔 值 。 在 function 函数 中 编写 
过 滤 条 件 ， 如 果 为 True 的 元 素 被 保留 ， 如 果 为 False 的 元 素 被 过 滤 掉 。 

下 面 通过 一 个 示例 介绍 filter() 函数 的 使 用 ， 示 例 代 码 如 下 : 


users = ['Tony', 'Tom', 'Ben', 'Alex'] 

users filter = filter(lambda u: u.startswith('T'), users) O 
print (list (users filter) ) 

输出 结果 : 

['Tony', 'Tom'] 


代码 第 @ 行 调用 了 filter( 函数 过 滤 users 列表 ， 过 滤 条 件 是 TT 开头 的 元 素 ，lambda u: 
u.startswith('T') 是 一 个 Lambda 表达 式 ， 它 提供 了 过 滤 条 件 。filter() 函数 还 不 是 一 个 列表 ， 需 
要 使 用 list( 函数 转换 过 滤 之 后 的 数据 为 列表 。 

再 看 一 个 示例 : 


number list = range(1，11) 
number filter = filter(lambda it: it % 2 == 0, number list) 
print (list (number filter)) 


该 示例 实现 了 获取 1~10 中 的 偶数 ， 输 出 结果 如 下 : 

[2, 4, 6, 8, 10] 

2. map() 

映射 操作 使 用 map() 函数 ， 它 可 以 对 可 迭代 对 象 的 元 素 进 行 变换 ，map() 函数 语法 如 下 : 
map (function, iterable) 


其 中 参数 function 是 一 个 函数 ， 参 数 iterable 是 可 友人 代 对 象 。map(0) 函数 调用 时 iterable 会 被 遍 
历 ， 它 的 元 素 被 逐一 传 入 function 函数 ， 在 function 函数 中 对 元 素 进 行 变 换 。 

下 面 通 过 一 个 示例 介绍 map() 函数 的 使 用 ， 示 例 代 码 如 下 : 

users = ['Tony', 'Tom', 'Ben', 'Alex'] 


users map = map(lambda u: u.lower(), users) @O 
print (list (users_map)) 


输出 结果 : 
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['tony', 'tom', 'ben', 'alex'] 


上 述 代 码 第 @ 行 调用 map() 函数 将 users 列表 元 素 转换 为 小 写字 母 ， 变 换 使 用 Lambda 表 
达 式 lambda u: u.lower()。map() 函数 返回 的 还 不 是 一 个 列表 ， 需 要 使 用 list() 函数 将 变换 之 后 
的 数据 转换 为 列表 。 

函数 式 编程 时 数据 可 以 从 一 个 函数 “ 流 ” 入 另外 一 个 函数 ， 但 遗憾 的 是 Python 并 不 支持 
“ 链 式 ”API。 例 如 ， 想 获取 users 列表 中 了 开头 的 名 字 ， 再 将 其 转换 为 小 写字 母 ， 这 样 的 需求 
需要 使 用 filter0 函数 进行 过 滤 ， 再 使 用 map() 函数 进行 映射 变换 。 实 现代 码 如 下 : 


users = ['Tony', 'Tom', 'Ben', 'Alex'] 
users filter = filter (lambda u: u.startswith('T'), users) 


# users map = map(lambda u: u.lower(), users filter) @ 
users map = map (lambda u: u.lower(), filter(lambda u: u.startswith('T'), users)) © 


print (list (users map)) 


上 述 代码 第 中 行 和 第 @ 行 实现 的 功能 相同 。 

3. reduce() 

聚合 操作 会 将 多 个 数据 聚合 起 来 输出 单个 数据 ， 聚 合 操作 中 最 基础 的 是 归纳 函数 reduce()， 
reduce() 函数 会 将 多 个 数据 按照 指定 的 算法 积累 县 加 起 来 ， 最 后 输出 一 个 数据 。 

reduce() 函数 语法 如 下 : 


reduce (function, iterable[, initializer]) 


参数 function 是 聚合 操作 函数 ， 该 函数 有 两 个 参数 ， 参 数 iterable 是 可 迭代 对 象 ， 参 数 
initializer 初始 值 。 

下 面 通 过 一 个 示例 介绍 reduce0 函数 的 使 用 。 下 面 示例 实现 了 对 一 个 数列 的 求 和 运算 ， 代 
码 如 下 : 


from functools import reduce (0) 


a= (1, 2, 3, 4) 

a_reduce = reduce (lambda acc, i: acc + i, a) # 10 @ 

# a_reduce = reduce (lambda acc, i: acc + i, a, 2) # 12 @ 

print(a_reduce) 

reduce() 函数 是 在 functools 模块 中 定义 的 ， 所 以 要 使 用 reduce0 函数 需要 导入 functools 
模块 ， 见 代码 第 中行 。 代 码 第 @ 行 调用 了 reduce0 函数 ， 其 中 lambda acc, i: acc + i 是 进行 聚 
合 操作 的 Lambda 表达 式 ， 该 Lambda 表达 式 有 两 个 参数 ， 其 中 acc 参数 是 上 次 累积 计算 结果 ， 
i 是 当前 元 素 ，acc + i 表达 式 是 进行 累加 。reduce() 函数 最 后 的 计算 结果 是 一 个 数值 ， 可 以 直 
接 通过 reduce() 函数 返回 。 代 码 第 @ 行 传 入 了 初始 值 2， 计 算 的 结果 是 12。 


本 章 小 结 


通过 对 本 章 内 容 的 学 习 ， 读 者 可 以 熟悉 如 何在 Python 中 定义 函数 、 函 数 参数 和 函数 返回 
值 ， 了 解 函 数 变量 作用 域 和 嵌 套 函数 。 最 后 还 介绍 了 Python 中 函数 式 编程 基础 。 


忆 


面向 对 象 是 Python 最 重要 的 特性 ， 在 Python 中 一 切 数据 类 型 都 是 面向 对 象 的 。 本 章 将 介 
绍 面向 对 象 的 基础 知识 。 


11.1 面向 对 象 概述 


面向 对 象 的 编程 思想 是 ， 按 照 真实 世界 客观 事物 的 自然 规律 进行 分 析 ， 客 观 世 界 中 存在 什 
么 样 的 实体 ， 构 建 的 软件 系统 就 存在 什么 样 的 实体 。 

例如 ， 在 真实 世界 的 学 校 里 ， 会 有 学 生 和 老师 等 实体 ， 学 生 有 学 号 、 姓 名 、 所 在 班级 等 属 
性 (数据 )， 学 生还 有 学 习 、 提 问 、 吃 饭 和 走路 等 操作 。 学 生 只 是 抽象 的 描述 ， 这 个 抽象 的 描 
述 称 为 “类 ”。 在 学 校 里 活动 的 是 学 生 个 体 ， 即 张 同学 、 李 同学 等 ， 这 些 具体 的 个 体 称 为 “对 
象 ”， 对 象 也 称 为 “实例 ”。 

在 现实 世界 有 类 和 对 象 ， 软 件 世界 也 有 面向 对 象 ， 只 不 过 它们 会 以 某 种 计算 机 语言 编写 的 
程序 代码 形式 存在 ， 这 就 是 面向 对 象 编程 (Object Oriented Programming，OOP) 。 


11.2 面向 对 象 三 个 基本 特性 
面向 对 象 思想 有 三 个 基本 特性 ， 封 装 性 、 继 承 性 和 多 态 性 。 
11.2.1 封装 性 


在 现实 世界 中 封装 的 例子 到 处 都 是 。 例 如 ， 一 台 计算 机 内 部 极其 复杂 ， 有 主板 、CPU、 硬 
盘 和 内 存 ， 而 一 般 用 户 不 需要 了 解 它 的 内 部 细节 ， 不 需要 知道 主板 的 型 号 、CPU 主 频 、 硬 盘 
和 内 存 的 大 小 ， 于 是 计算 机 制造 商用 机 箱 把 计算 机 封装 起 来 ， 对 外 提供 一 些 接口 ， 如 鼠标 、 键 
盘 和 显示 器 等 ， 这 样 当 用 户 使 用 计算 机 时 就 变 得 非常 方便 。 

面向 对 象 的 封装 与 真实 世界 的 目的 是 一 样 的 。 封 装 能 够 使 外 部 访问 者 不 能 随意 存 取 对 象 的 
内 部 数据 ， 隐 藏 了 对 象 的 内 部 细节 ， 只 保留 有 限 的 对 外 接口 。 外 部 访问 者 不 用 关心 对 象 的 内 部 
细节 ， 操 作对 象 变 得 简单 。 


11.2.2 ”继承 性 


在 现实 世界 中 继承 也 是 无 处 不 在 。 例 如 轮船 与 客轮 之 间 的 关系 ， 客 轮 是 一 种 特殊 的 轮 
船 ， 拥 有 轮船 的 全 部 特征 和 行为 ， 即 数据 和 操作 。 在 面向 对 象 中 ， 轮 船 是 一 般 类 ， 客 轮 是 特 
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殊 类 ， 特 殊 类 拥有 一 般 类 的 全 部 数据 和 操作 ， 称 为 特殊 类 继承 一 般 类 。 一 般 类 称 为 “ 父 类 ” 
或 “ 超 类 ”， 特 殊 类 称 为 “ 子 类 ”或 “派生 类 ”。 为 了 统一 ， 本 书 中 一 般 类 统称 为 “ 父 类 ”， 
特殊 类 统称 为 “ 子 类 ”。 


11.2.3 多 态 性 
多 态 性 是 指 在 父 类 中 成 员 被 子 类 继承 之 后 ， 可 以 具有 不 同 的 状态 或 表现 行为 。 


11.3 ”类 和 对 和 象 


Python 中 的 数据 类 型 都 是 类 ， 类 是 组 成 Python 程序 的 基本 要 素 ， 它 封装 了 一 类 对 象 的 数 [ 
据 和 操作 。 


11.3.1 定义 类 
Python 语言 中 一 个 类 的 实现 包括 类 定义 和 类 体 。 类 定义 语法 格式 如 下 : 


class 类 名 [ ( 父 类 ) ] : 
类 体 


其 中 ，class 是 声明 类 的 关键 字 ,“ 类 名 ”是 自 定义 的 类 名 ， 自 定义 类 名 首先 应 该 是 合法 的 标识 
符 ， 具 体 要 求 参考 4.1.1 节 ， 且 应 该 遵守 Python 命名 规范 ， 采 用 大 驼峰 法 命名 法 ， 具 体 规范 参 
考 5.1 节 。“ 父 类 ”声明 当前 类 继承 的 父 类 ， 父 类 可 以 省 略 声明 ， 表 示 直 接 继承 object 类 。 
定义 动物 (Animal) 类 代码 如 下 : 
class Animal (object): 


# 类 体 


pass 


上 述 代码 声明 了 动物 类 ， 它 继承 了 object 类 ，object 是 所 有 类 的 根 类 ， 在 Python 中 任何 
一 个 动物 类 都 直接 或 间接 继承 object， 所 以 (object) 部 分 代码 可 以 省 略 。 


提示 : 代码 的 pass 语句 什么 操作 都 不 执行 ， 用 来 维持 程序 结构 的 完整 。 有 些 不 想 编写 的 
代码 ， 又 不 想 有 语法 错误 ， 可 以 使 用 pass 语句 占 位 。 


11.3.2 ”创建 和 使 用 对 象 


前 面 章节 已 经 多 次 用 到 了 对 象 ， 类 实例 化 可 生成 对 象 ， 所 以 “对 象 ”也 称 为 “实例 ”。 一 
个 对 象 的 生命 周期 包括 三 个 阶段 : 创建 、 使 用 和 销毁 。 销 毁 对 象 时 Python 的 垃圾 回收 机 制 释 
放 不 再 使 用 对 象 的 内 存 ， 不 需要 程序 员 负 责 。 程 序 员 只 关心 创建 和 使 用 对 象 ， 这 一 节 介绍 创建 
和 使 用 对 象 。 

创建 对 象 很 简单 ， 就 是 在 类 后 面 加 上 一 对 小 括号 ， 表 示 调 用 类 的 构造 方法 。 这 就 创建 了 一 
个 对 象 ， 示 例 代 码 如 下 : 


animal = Rnimal() 


Animal 是 上 一 节 定 义 的 动物 类 ，Animal() 表达 式 创建 了 一 个 动物 对 象 ， 并 把 创建 的 对 象 
赋值 给 animal 变量 ，animal 是 指向 动物 对 象 的 一 个 引用 。 通 过 animal 变量 可 以 使 用 刚刚 创建 
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的 动物 对 象 。 如 下 代码 打印 输出 动物 对 象 。 


print (animal) 


输出 结果 如 下 : 


<_main .Animal object at 0x0000024A18CB90F0> 


print 函数 打印 对 象 会 输出 一 些 很 难 懂 的 信息 。 事 实 上 ，print 函数 调用 了 对 象 的 _ str_() 
方法 输出 字符 串 信息 ，_str_( 是 object 类 的 一 个 方法 ， 它 会 返回 有 关 该 对 象 的 描述 信息 ， 由 
于 本 例 中 Animal 类 的 _str (方法 是 默认 实现 的 ， 所 以 会 返回 这 些 难 懂 的 信息 ， 如 果 要 打印 
出 友好 的 信息 ， 需 要 重 写 _str 0 方法 。 


提示 : _ str_() 这 种 双 下 画 线 开始 和 结尾 的 方法 是 Python 保留 的 ， 有 着 特殊 的 含义 ， 称 
为 魔法 方法 。 


11.3.3 实例 变量 


在 类 体 中 可 以 包含 类 的 成 员 ， 类 成 员 如 图 11-1 所 示 ， 其 中 包括 成 员 变量 、 成 员 方法 和 属 
性 ， 成 员 变 量 又 分 为 实例 变量 和 类 变量 ， 成 员 方 法 又 分 为 实例 方法 、 类 方法 和 静态 方法 。 


Fe ~ 
成 员 变量 属性 
人 (property) 


省 时 时 
了 部 
宣 
过 
Ea 


图 11-1 类 成 员 


提示 : 在 Python 类 成 员 中 有 attribute 和 property， 见 图 11-1。attribute 是 类 中 保存 数据 的 
变量 ， 如 果 需 要 对 attribute 进行 封装 ， 那 么 在 类 的 外 部 为 了 访问 这 些 attribute， 往 往 会 提供 一 
此 setter 和 getter 访问 器 。setter 访问 器 是 对 attribute 赋值 的 方法 ，getter 访问 器 是 取 attribute 
值 的 方法 ， 这 些 方法 在 创建 和 调用 时 都 比较 麻烦 ， 于 是 Python 又 提供 了 property，property 本 
质 上 就 是 setter 和 getter 访问 器 ， 是 一 种 方法 。 一般 情况 下 attribute 和 property 中 文 都 翻译 为 

“属性 ”， 这 样 很 难 区 分 两 者 的 含义 ， 也 有 很 多 书 将 attribute 翻译 为 “特性 ”。“ 属 性 ”和 “ 特 
性 ”在 中 文中 区 别 也 不 大 。 其 实 很 多 语言 都 有 attribute 和 property 概念 ， 例 如 Objective-C 中 
attribute 称 为 成 员 变量 (或 字段 )，property 称 为 属性 。 本 书 采 用 Objective-C 提 法 将 attribute 
翻译 为 “成 员 变 量 "”， 而 property 翻译 为 “属性 ”。 


“实例 变量 ”就 是 某 个 实例 (或 对 象 ) 个 体 特有 的 “数据 ”例如 你 家 狗 狗 的 名 字 、 年 龄 和 
性 别 与 邻居 家 狗 狗 的 名 字 、 年 龄 和 性 别 是 不 同 的 。 本 节 先 介绍 实例 变量 。 
了 Python 中 定义 实例 变量 的 示例 代码 如 下 。 
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class Rnimal (object) : @O 
""" 定义 动物 类 """ 
def _init (self, age, sex, weight): [@) 
self.age = age # 定义 年 龄 实例 变量 四 
self.sex = sex # 定义 性 别 实例 变量 
self.weight = weight # 定义 体重 实例 变量 
animal = Rnimal(2，1，10.0) 
print (' 年 龄 : {0}'.format (animal.age)) @ 


print(' 性 别 ， {0}' .format (' 肉 性 ' if animal.sex == 0 else ' 梭 性 ')) 
print (' 体重 : {0}'.format (animal .weight)) 


上 述 代码 第 外 行 是 定义 Animal 动物 类 ， 代 码 第 回 行 是 构造 方法 ， 构 造 方法 是 用 来 创建 和 
初始 化 实例 变量 的 ， 有 关 构 造 方法 11.3.5 节 再 详细 介绍 ， 这 里 不 再 装 述 。 构 造 方法 中 的 self 指 
向 当前 对 象 实例 的 引用 。 代 码 第 @ 行 是 在 创建 和 初始 化 实例 变量 age， 其 中 self.age 表示 对 象 
的 age 实例 变量 。 

代码 第 @ 行 是 访问 age 实例 变量 ， 实 例 变量 需要 通过 “实例 名 . 实例 变量 ”的 形式 访问 。 


11.3.4 ”类 变量 


“类 变量 ”是 所 有 实例 (或 对 象 ) 共有 的 变量 。 例 如 有 一 个 Account (银行 账户 ) 类 ， 它 
有 三 个 成 员 变 量 : amount (账户 金额 ) 、interest_rate (利率 ) 和 owner (账户 名 ) 。 在 这 三 个 成 
员 变 量 中 ，amount 和 owner 会 因 人 而 异 ， 对 于 不 同 的 账户 这 些 内容 是 不 同 的 ， 而 所 有 账户 
的 interest_rate 都 是 相同 的 。amount 和 owner 成 员 变 量 与 账户 个 体 实例 有 关 ， 称 为 “实例 变量 ”， 
interest_rate 成 员 变 量 与 个 体 实例 无 关 ， 或 者 说 是 所 有 账户 实例 共享 的 ， 这 种 变量 称 为 “类 变量 ”。 
类 变量 示例 代码 如 下 : 


class Account: 


""" 定义 银行 账户 类 """ 
interest_rate = 0.0668 # 类 变量 利率 [0 


def _init_ (self, owner, amount): 
self.owner = owner # 定义 实例 变量 账户 名 
self.amount = amount # 定义 实例 变量 账户 金额 


account = Account('Tony', 1 800_000.0) 


print (' 账户 名 : {0}"'.format (account .owner)) 
print (' 账户 金额 ; {0}' .format (account .amount)) 
print(' 利率 : {0}'.format (Account.interest_ rate)) 


输出 结果 如 下 : 


账户 名 : Tony 
账户 金额 : 1800000.0 
利率 : 0.0668 
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代码 第 @ 行 是 创建 并 初始 化 类 变量 。 创 建 类 变量 与 实例 变量 不 同 ， 类 变量 要 在 方法 之 外 定 
义 。 代 码 第 @ 行 是 访问 实例 变量 ， 通 过 “实例 名 . 实例 变量 ”的 形式 访问 。 代 码 第 @ 行 是 访问 
类 变量 ， 通 过 “类 名 . 类 变量 ”的 形式 访问 。“ 类 名 . 类 变量 ”事实 上 是 有 别 于 包 和 模块 的 另外 
一 种 形式 的 命名 空间 。 


注意 : 不 要 通过 实例 存 取 类 变量 数据 。 当 通过 实例 读 取 变 量 时 ,Python 解释 器 会 先 在 实例 
中 找 这 个 变量 ， 如 果 没 有 再 到 类 中 去 找 ; 当 通 过 实例 为 变量 赋值 时 ， 无 论 类 中 是 否 有 该 同名 变 
量 ，Python 解释 器 都 会 创建 一 个 同名 实例 变量 。 

在 类 变量 示例 中 添加 如 下 代码 : 


print ('Account 利率 : {0}'.format (Account.interest rate)) 


print ('acl 利率 : {0}'.format (account.interest_rate)) O 
print ('acl 实例 所 有 变量 : {0}'.format (account._dict )) 加 
account .interest_rate = 0.01 @ 
account.interest rate2 = 0.01 @ 
print ('acl 实例 所 有 变量 : {0}'.format (account._dict )) © 


输出 结果 如 下 : 


Account 利率 : 0.0668 

acl 利率 : 0.0668 

acl 实例 所 有 变量 : { 'owner' : 'Tony'，'amount': 1800000.0} 

acl 实 例 所 有 变量 : {'owner': 'Tony', 'amount': 1800000.0, 'interest rate': 0.01, 


'interest rate2': 0.01} 


上 述 代码 第 Q@ 行 通过 实例 读 取 interest_rate 变量 ， 解 释 器 发 现 account 实例 中 没有 该 变量 ， 
然后 会 在 Account 类 中 找 ， 如 果 类 中 也 没有 ， 会 发 生 AttributeError 错误 。 虽 然 通过 实例 读 取 
interest_rate 变量 可 以 实现 ， 但 不 符合 设计 规范 。 

代码 第 @ 行 为 account.interest_rate 变量 赋值 ， 这 样 的 操作 下 无 论 类 中 是 否 有 同名 类 变量 都 
会 创建 一 个 新 的 实例 变量 。 为 了 查看 实例 变量 有 哪些 ， 可 以 通过 object 提供 的 _dict 变量 查 
看 ， 见 代码 第 @ 行 和 第 @ 行 。 从 输出 结果 可 见 ， 代 码 第 @ 行 和 第 @ 行 的 赋值 操作 会 导致 创建 了 
两 个 实例 变量 interest_rate 和 interest_rate2。 


提示 : 代码 第 鲜 行 和 第 图 行 能 够 在 类 之 外 创建 实例 变量 ， 主 要 原因 是 Python 的 动态 语言 
特性 ，Python 不 能 从 语法 层面 禁止 此 事 的 发 生 。 这 样 创建 实例 变量 会 引起 很 严重 的 问题 ， 一 方 
面 ， 类 的 设计 者 无 法 控制 一 个 类 中 有 哪些 成 员 变 量 ; 另 一 方面 ， 这 些 实 例 变 量 无 法 通过 类 中 的 
方法 访问 。 


11.3.5 ”构造 方法 

在 11.3.3 节 和 11.3.4 节 中 都 使 用 了 init 0 方法， 该 方法 用 来 创建 和 初始 化 实例 变量 ， 
这 种 方法 就 是 “构造 方法 ”。_init 0 方法 也 属于 魔法 方法 。 定 义 时 它 的 第 一 个 参数 应 该 是 
self， 其 后 的 参数 才 是 用 来 初始 化 实例 变量 的 。 调 用 构造 方法 时 不 需要 传 入 self。 
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构造 方法 示例 代码 如 下 : 
class Animal (object): 
won 定义 动物 类 www 
def _init_ (self，age，sex=1，weight=0.0) : [0) 
self.age = age # 定义 年 龄 实例 变量 
self.sex = sex # 定义 性 别 实例 变量 


self.weight = weight # 定义 体重 实例 变量 


al = Animal(2, 0, 10.0) 
a2 = Animal (1, weight=5.0) 
a3 = Animal (1, sex=0) 


print ('al 年 龄 ，{0}'.format (al.age)) 

print ('a2 体重 : {0}'.format (a2.weight)) 

print ('a3 性 别 ， {0}'.format(' 肉 性 ' if a3.sex == 0 else ' 梭 性 ')) 

上 述 代码 第 @ 行 是 定义 构造 方法 ， 其 中 参数 除了 第 一 个 self 外 ， 其 他 的 参数 可 以 有 默认 值 ， 
这 也 提供 了 默认 值 的 构造 方法 ， 能 够 给 调用 者 提供 多 个 不 同形 式 的 构造 方法 。 代 码 第 @ 行 和 第 
@ 行 是 调用 构造 方法 创建 Animal 对 象 ， 其 中 不 需要 传 入 self， 只 需要 提供 后 面 的 三 个 实际 参数 。 


11.3.6 ”实例 方法 


实例 方法 与 实例 变量 一 样 都 是 某 个 实例 (或 对 象 ) 个 体 特 有 的 。 本 节 先 介绍 实例 方法 。 

方法 是 在 类 中 定义 的 函数 。 而 定义 实例 方法 时 它 的 第 一 个 参数 也 应 该 是 self， 这 个 过 程 是 
将 当前 实例 与 该 方法 绑 定 起 来 ， 使 该 方法 成 为 实例 方法 。 

下 面 看 一 个 定义 实例 方法 示例 。 


class Animal (object) : 


wm 定义 动物 类 """ 

def _init_ (self，age，sex=1，weight=0.0) : 
self.age = age # 定义 年 龄 实例 变量 
self.sex = sex # 定义 性 别 实例 变量 


self.weight = weight # 定义 体重 实例 变量 


def eat (self): [0 
self.weight += 0.05 
print('eat...') 


def runl(self): ©@ 
self.weight -= 0.01 


print('run...') 


al = Animal(2, 0, 10.0) 
print ('al 体重 : {0:0.2f}' .format (al.weight)) 
al.eat () 
print ("al 体重 : {0:0.2f}' .format (al.weight)) 
al.run() 
print ("'al 体重 : {0:0.2f}' .format (al.weight)) 
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运行 结果 如 下 : 


al 体重 : 10.00 
eatess 
al 体重 : 10.05 
i 
al 体重 : 10.04 


上 述 代码 第 @ 行 和 第 @ 行 声明 了 两 个 方法 ， 其 中 第 一 个 参数 是 self。 代 码 第 @ 行 和 第 @ 行 
是 调用 这 些 实例 方法 ， 注 意 其 中 不 需要 传 入 self 参数 。 


11.3.7 类 方法 


“类 方法 ”与 “类 变量 ”类 似 属 于 类 ， 不 属于 个 体 实例 的 方法 ， 类 方法 不 需要 与 实例 绑 定 ， 
但 需要 与 类 绑 定 ， 定 义 时 它 的 第 一 个 参数 不 是 self， 而 是 类 的 type 实例 。type 是 描述 Python 
数据 类 型 的 类 ，Python 中 所 有 数据 类 型 都 是 type 的 一 个 实例 。 

定义 类 方法 示例 代码 如 下 : 


class Account: 


""" 定义 银行 账户 类 """ 


interest_rate = 0.0668 # 类 变量 利率 


def _init (self, owner, amount): 
self.owner = owner # 定义 实例 变量 账户 名 
self.amount = amount # 定义 实例 变量 账户 金额 


# 类 方法 
@classmethod 
def interest byl(cls, amt): O 
return cls.interest rate * amt @ 
interest = Account.interest by(12 000.0) @ 
print (' 计算 利息 ; {0:.4f}'.format (interest)) 
运行 结果 如 下 : 


计算 利息 801. 6000 


定义 类 方法 有 两 个 关键 : 第 一 ， 方 法 第 一 个 参数 cls ( 见 代 码 @ 行 ) 是 type 类型， 是 当前 
Account 类 型 的 实例 ， 第 二 ， 方 法 使 用 装饰 器 @classmethod 声明 该 方法 是 类 方法 。 


提示 : 装饰 器 ( Decorators) 是 Python 3.0 之 后 加 入 的 新 特性 ， 以 @ 开头 修饰 函数 、 方 法 
和 类 ， 用 来 修饰 和 约束 它们 ， 类 似 于 Java 中 的 注解 。 


代码 第 @ 行 是 方法 体 ， 在 类 方法 中 可 以 访问 其 他 的 类 变量 和 类 方法 ，cls.interest_rate 是 访 
问 类 方法 interest_rate。 


注意 : 类 方法 可 以 访问 类 变量 和 其 他 类 方法 ， 但 不 能 访问 其 他 实例 方法 和 实例 变量 。 


代码 第 @ 行 是 调用 类 方法 interest by0， 采 用 “类 名 . 类 方法 ”形式 调用 。 从 语法 角度 可 
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以 通过 实例 调用 类 方法 ， 但 这 不 符合 规范 。 
11.3.8 ”静态 方法 


如 果 定 义 的 方法 既 不 想 与 实例 绑 定 ， 也 不 想 与 类 绑 定 ， 只 是 想 把 类 作为 它 的 命名 空间 ， 那 
么 可 以 定义 静态 方法 。 
定义 静态 方法 示例 代码 如 下 : 


class Account: 


wun 定义 银行 账户 类 "ww 
interest_rate = 0.0668 # 类 变量 利率 


def _init (self, owner, amount): 


self.owner = owner # 定义 实例 变量 账户 名 
self.amount = amount # 定义 实例 变量 账户 金额 
# 类 方法 
@classmethod 


def interest byl(cls, amt): 
return cls.interest rate * amt 


# 静态 方法 
@staticmethod 
def interest_with (amt) : 


@e 


return Rccount .interest_by(amt) 


interestl = Account.interest by(12 000.0) 

print (' 计算 利息 ; {0:.4f}'.format (interest1)) 

interest2 = Account.interest with(12 000.0) @ 
print (' 计算 利息 ; {0:.4f}'.format (interest2)) 


上 述 代码 第 @ 行 是 定义 静态 方法 ， 使 用 了 @staticmethod 装饰 器 ， 声 明 方 法 是 静态 方法 ， 
方法 参数 不 指定 self 和 cls。 代 码 第 @ 行 调用 了 类 方法 。 调 用 静态 方法 与 调用 类 方法 类 似 都 通 
过 类 名 实现 ， 但 也 可 以 通过 实例 调用 。 

类 方法 与 静态 方法 在 很 多 场景 是 类 似 的 ， 只 是 在 定义 时 有 一 些 区 别 。 类 方法 需要 绑 定 类 ， 
静态 方法 不 需要 绑 定 类 ， 静 态 方法 与 类 的 耦合 度 更 加 松散 。 在 一 个 类 中 定义 静态 方法 只 是 为 了 
提供 一 个 基于 类 名 的 命名 空间 。 


11.4 封装 性 


封装 性 是 面向 对 象 的 三 大 特性 之 一 ，Python 语言 没有 与 封装 性 相关 的 关键 字 ， 它 通过 特定 
的 名 称 实现 对 变量 和 方法 的 封装 。 


11.4.1 私有 变量 


默认 情况 下 Python 中 的 变量 是 公有 的 ， 可 以 在 类 的 外 部 访问 它们 。 如 果 想 让 它们 成 为 私 
有 变量 ， 可 以 在 变量 前 加 上 双 下 画 线 “_”。 
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示例 代码 如 下 : 
class Animal (object): 
""" 定义 动物 类 """ 
def _init (self, age, sex=1, weight=0.0): 
self.age = age # 定义 年 龄 实例 变量 
self.sex = sex # 定义 性 别 实例 变量 
self. weight = weight # 定义 体重 实例 变量 [0 


def eat (self): 
self. weight += 0.05 
print('eat...') 


def run(self) : 
self. weight -= 0.01 
print('run...') 


al = Animal(2, 0, 10.0) 


print ('al 体重 : {0:0.2f}'.format (al.weight)) ©@ 
al.eat () 
al.run() 


运行 结果 如 下 : 


Traceback (most recent call last): 
File "C:/Users/tony/PycharmProjects/HelloProj/chll1.4.1.py", line 24, in <module> 
print("al 体重 : {0:0.2f}'.format (al.weight)) 
AttributeError: '‘'Animal' object has no attribute 'weight'" 


上 述 代码 第 四 行 在 weight 变量 前 加 上 双 下 画 线 ， 这 会 定义 私有 变量 _ weight。_weight 
变量 在 类 内 部 访问 没有 问题 ， 但 是 如 果 在 外 部 访问 则 会 发 生 错 误 ， 见 代码 第 @ 行 。 


提示 : Python 中 并 没有 严格 意义 上 的 封装 ， 所 谓 的 私有 变量 只 是 形式 上 的 限制 。 如 果 想 在 
类 的 外 部 访问 这 些 私 有 变量 也 是 可 以 的 ， 这 些 双 下 画 线 “ ”开头 的 私有 变量 其 实 只 是 换 了 一 
个 名 字 ， 它 们 的 命名 规律 为 “_ 类 名 变量 *"， 所 以 将 上 述 代 码 al.weight 改 成 al. Animal 
weight 就 可 以 访问 了 ， 但 这 种 访问 方式 并 不 符合 规范 ， 会 破坏 封装 。 可 见 Python 的 封装 性 靠 
的 是 程序 员 的 自律 ， 而 非 强制 性 的 语法 。 


11.4.2 私有 方法 


私有 方法 与 私有 变量 的 封装 是 类 似 的 ， 只 要 在 方法 前 加 上 双 下 画 线 “ ”就 是 私有 方法 了 。 
示例 代码 如 下 : 


class Animal (object): 


"…"" 定义 动物 类 """ 


def _init (self, age, sex=1, weight=0.0): 
self.age = age # 定义 年 龄 实例 变量 
self.sex = sex ## 定义 性 别 实例 变量 
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self. weight = weight # 定义 体重 实例 变量 


def eat (self): 
self._ weight += 0.05 
self._run() 


print('eat...') 


def _ run(self): [0 
self. weight -= 0.01 
print('run...') 


al = Animal(2, 0, 10.0) 


al.eat() 
al.run() @ 


运行 结果 如 下 : 


eat... 
Traceback (most recent call last): 
File "C:/Users/tony/PycharmProjects/HelloProj/chl1.4.2.py", line 25, in <module> 
al.run() 
AttributeError: 'Rnimal' object has no attribute "run' 


上 述 代码 第 @ 行 中 _run() 方 法 是 私有 方法 ，_run0 方法 可 以 在 类 的 内 部 访问 ， 不 能 在 类 


的 外 部 访问 ， 否 则 会 发 生 错误 ， 见 代码 第 @ 行 。 


提示 : 如 果 一 定 要 在 类 的 外 部 访问 私有 方法 也 是 可 以 的 。 与 私有 变量 访问 类 似 ， 命 名 规律 


为 “ 类 名 方法” 。 这 也 不 符合 规范 ， 也 会 破坏 封装 。 


11.4.3 定义 属性 
封装 通常 是 对 成 员 变量 进行 的 封装 。 在 严格 意义 上 的 面向 对 象 设计 中 ， 一 个 类 是 不 应 该 


有 公有 的 实例 成 员 变 量 的 ， 这 些 实例 成 员 变量 应 该 被 设计 为 私有 的 ， 然 后 通过 公有 的 setter 和 
getter 访问 器 访问 。 


使 用 setter 和 getter 访问 器 的 示例 代码 如 下 : 


class Animal (object): 


www 定义 动物 类 "ww 

def _init_ (self，age，sex=1，weight=0.0) : 
self.age = age # 定义 年 龄 实例 成 员 变量 
self.sex = sex # 定义 性 别 实例 成 员 变量 
self. weight = weight # 定义 体重 实例 成 员 变量 

def set weight (self, weight): OO 


self._ weight = weight 


def get_weight (self) : 四 


return self. weight 
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al = Animal(2, 0, 10.0) 

print ("al 体重 : {0:0.2f}'.format (al.get weight ())) 
al.set weight (123.45) 

print ("al 体重 : {0:0.2f}'.format (al.get_weight ())) 


运行 结果 如 下 : 


al 体重 : 10.00 
al 体重 : 123.45 


上 述 代 码 第 @ 行 中 set_weight() 方法 是 setter 访问 器 ， 它 有 一 个 参数 ， 用 来 蔡 换 现 有 成 员 
变量 。 代 码 第 @ 行 的 get_weight( 方法 是 getter 访问 器 。 代 码 第 @ 行 是 调用 getter 访问 器 。 代 
码 第 @ 行 是 调用 setter 访问 器 。 

访问 器 形式 的 封装 需要 一 个 私有 变量 ， 需 要 提供 getter 访问 器 和 一 个 setter 访问 器 ， 只 读 
变量 不 用 提供 setter 访问 器 。 总 之 ,访问 器 形式 的 封装 在 编写 代码 时 比较 麻烦 。 为 了 解决 这 个 
问题 ，Python 中 提供 了 属性 (property)， 定 义 属性 可 以 使 用 @property 和 @ 属性 名 .setter 装 
饰 器 ，@property 用 来 修饰 getter 访问 器 ，@ 属性 名 .setter 用 来 修饰 setter 访问 器 。 

使 用 属性 修改 前 面 的 示例 代码 如 下 : 


class Animal (object): 


""" 定义 动物 类 """ 


©@ 


def _init (self, age, sex=], weight=0.0): 
self.age = age # 定义 年 龄 实例 成 员 变量 
self.sex = sex # 定义 性 别 实例 成 员 变量 
self. weight = weight “ # 定义 体重 实例 成 员 变 量 


@property 
def weight (self): # 替代 get_weight (self): (0) 
return self. weight 


@weight.setter 
def weight (self, weight): # 替代 set_weight (self, weight): (2) 
self. weight = weight 


al = Animal(2, 0, 10.0) 

print ("al 体重 : {0:0.2f}'.format (al .weight)) @ 
al.weight = 123.45 # al.set weight (123.45) 四 
print("al 体重 : {0:0.2f}'.format (al.weight)) 


上 述 代码 第 @ 行 是 定义 属性 getter 访问 器 ， 使 用 了 @property 装饰 器 进行 修饰 ， 方 法 名 就 
是 属性 名 ， 这 样 就 可 以 通过 属性 取 值 了 ， 见 代码 第 @@ 行 。 

代码 第 @@ 行 是 定义 属性 setter 访问 器 ， 使 用 了 @weight.setter 装饰 器 进行 修饰 ，weight 是 
属性 名 ， 与 getter 和 setter 访问 器 方法 名 保持 一 致 ， 可 以 通过 al.weight = 123.45 赋值 ， 见 代码 
第 四 行 。 

从 上 述 示例 可 见 ， 属 性 本 质 上 就 是 两 个 方法 ， 在 方法 前 加 上 装饰 器 使 得 方法 成 为 属性 。 属 
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性 使 用 起 来 类 似 于 公有 变量 ， 可 以 在 赋值 符 “=” 左 边 或 右边 ， 左 边 是 被 赋值 ， 右 边 是 取 值 。 


提示 : 定义 属性 时 应 该 先 定义 getter 访问 器 ， 再 定义 setter 访问 器 ， 即 代码 第 四 行 和 第 @ 
行 不 能 颠倒 ， 否 则 会 出 现 错误 。 这 是 因为 @property 修饰 getter 访问 器 时 ， 定 义 了 weight 属 
性 ， 这 样 在 后 面 使 用 @weight.setter 装饰 器 才 是 合法 的 。 


11.5 ”继承 性 
类 的 继承 性 是 面向 对 象 语言 的 基本 特性 ， 多 态 性 的 前 提 是 继承 性 。 


11.5.1 ”继承 概念 


为 了 了 解 继承 性 ， 先 看 这 样 一 个 场景 : 一 位 面向 对 象 的 程序 员 小 赵 ， 在 编程 过 程 中 需要 描 
述 和 处 理 个 人 信息 ， 于 是 定义 了 类 Person， 如 下 所 示 : 


class Person: 


mi 
扫 码 看 视频 


def _init_ (self, name, age): 


self.name = name # 名 字 
self.age = age # 年 龄 
def info(self) : 


template = 'Person [name={0}, age={1}]" 
3 = template.format (self.name, self.age) 
return s 


一 周 以 后 ， 小 赵 又 遇 到 了 新 的 需求 ， 需 要 描述 和 处 理学 生 信息 ， 于 是 他 又 定义 了 一 个 新 的 
类 Student， 如 下 所 示 : 


class Student: 


def _init_ (self, name, age, school) 


self.name = name # 名 字 
self.age = age # 年 龄 
self.school = school # 所 在 学 校 


def info(self) : 
template = 'Student [name={0}, age={1}, school={2}]" 
3 = template.format (self.name, self.age, self.school) 


return 3 
很 多 人 会 认为 小 赵 的 做 法 能 够 被 理解 并 认为 这 是 可 行 的 ， 但 问题 在 于 Student 和 Person 两 
个 类 的 结构 太 接 近 了 ， 后 者 只 比 前 者 多 了 一 个 school 实例 变量 ， 却 要 重复 定义 其 他 所 有 的 内 容 ， 
实在 让 人 “不 甘心 ”。Python 提供 了 解决 类 似 问题 的 机 制 ， 那 就 是 类 的 继承 ， 代 码 如 下 所 示 : 
class Student (Person): @ 
def _init (self, name, age, school): 


加 
super()._init (name, age) @ 
self.school = school 专 所 在 学 校 @ 
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上 述 代码 第 @ 行 是 声明 Student 类 继承 Person 类 ， 其 中 小 括号 中 的 是 父 类 ， 如 果 没 有 指明 
父 类 (一 对 空 的 小 括号 或 省 略 小 括号 )， 则 默认 父 类 为 object，object 类 是 Python 的 根 类 。 代 码 
第 @ 行 定义 构造 方法 ， 子 类 中 定义 构造 方法 时 首先 要 调用 父 类 的 构造 方法 ， 初 始 化 父 类 实例 变 
量 。 代 码 第 @ 行 super()， init (name, age, birth_date) 语句 是 调用 父 类 的 构造 方法 ，super() 函 
数 是 返回 父 类 引用 ， 通 过 它 可 以 调用 父 类 中 的 实例 变量 和 方法 。 代 码 第 @ 行 是 定义 school 实 
例 变 量 。 


提示 : 子 类 继承 父 类 时 只 是 继承 父 类 中 公有 的 成 员 变 量 和 方法 ， 不 能 继承 私有 的 成 员 变量 
和 方法 。 


11.5.2 重 写 方法 


如 果子 类 方法 名 与 父 类 方法 名 相同 ， 而 且 参 数列 表 也 相同 ， 只 是 方法 体 不 同 ， 那 么 子 类 重 
写 (Override) 了 父 类 的 方法 。 
示例 代码 如 下 : 
class Animal (object): 
""" 定义 动物 类 """ 
def _init (self, age, sex=]1, weight=0.0): 
self.age = age 
self.sex = sex 
self.weight = weight 


def eat (self): @ 
self.weight += 0.05 
print (' 动物 吃 ...') 


class Dog (Animal): 
def eat (self): © 
self.weight += 0.1 
Print (' 狗 狗 吃 ...') 


al = Dog(2, 0, 10.0) 
al.eat() 


输出 结果 如 下 : 
狗 狗 吃 ... 


上 述 代码 第 @ 行 是 父 类 中 定义 eat0 方法 ， 子 类 继承 父 类 并 重 写 了 eat0 方法 ， 见 代码 第 @ 
行 。 那 么 通过 子 类 实例 调用 eat( 方法 时 ， 会 调用 子 类 重 写 的 eat()。 


11.5.3 多 继承 


所 谓 多 继承 ， 就 是 一 个 子 类 有 多 个 父 类 。 大 部 分 计算 语言 如 Java、Swift 等 ， 只 支持 
单 继 承 ， 不 支持 多 继承 。 主 要 是 多 继承 会 发 生 方 法 冲突 。 例 如 ， 客 轮 是 轮船 也 是 交通 工具 ， 
客轮 的 父 类 是 轮船 和 交通 工具 ， 如 果 两 个 父 类 都 定义 了 run0) 方法 ， 子 类 客轮 继承 哪 一 个 
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run() 方法 呢 ? 

Python 支持 多 继承 ， 但 Python 给 出 了 解决 方法 名 字 冲 突 的 方案 。 这 个 方案 是 ， 当 子 类 实 
例 调用 一 个 方法 时 ， 先 从 子 类 中 查找 ， 如 果 没 有 找到 则 查找 父 类 。 父 类 的 查找 顺序 是 按照 子 类 
声明 的 父 类 列表 从 左 到 右 查 找 ， 如 果 没 有 找到 再 找 父 类 的 父 类 ， 依 次 查找 下 去 。 

多 继承 示例 代码 如 下 : 

class ParentClassl: 


def run(self) : 


Print('"ParentClassl run...') 


class ParentClass2: 
def run(self) : 


print('ParentClass2 run...') 


class SubClassl (ParentClassl, ParentClass2): 
pass 


class SubClass2 (ParentClass2, ParentClass1): 


pass 


class SubClass3(ParentClassl, ParentClass2): 
def run(self) : 
print("SubClass3 runess'") 


subl = SubCclassl() 
subl.run() 
sub2 = SubClass2() 
sub2.run() 
sub3 = SubClass3() 


sub3.run() 


输出 结果 如 下 : 


ParentClassl run... 
ParentClass2 run... 


SubClass3 run... 


上 述 代 码 中 定义 了 两 个 父 类 ParentClassl 和 ParentClass2， 以 及 三 个 子 类 SubClass1、 
SubClass2 和 SubClass3， 这 三 个 子 类 都 继承 了 ParentClassl 和 ParentClass2 两 个 父 类 。 当 子 类 
SubClassl 的 实例 subl 调用 run() 方法 时 ， 解 释 器 会 先 查 找 当前 子 类 是 否 有 run() 方法 ， 如 果 
没有 则 到 父 类 中 查找 ， 按 照 父 类 列表 从 左 到 右 的 顺序 ， 找 到 ParentClassl 中 的 run0) 方法 ， 所 
以 最 后 调用 的 是 ParentClassl 中 的 run0) 方法 。 按 照 这 个 规律 ， 其 他 的 两 个 实例 sub2 和 sub3 
调用 哪 一 个 run() 方法 就 很 容易 知道 了 。 


11.6 ”多 态 性 


在 面向 对 象 程序 设计 中 ， 多 态 是 一 个 非常 重要 的 特性 ， 理 解 多 态 有 利于 进行 面向 对 象 的 分 区 
析 与 设计 。 要 码 看 视频 
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11.6.1 多 态 概念 


发 生 多 态 要 有 两 个 前 提 条 件 : 第 一 、 继 承 一 一 多 态 发 生 一 定 是 子 类 和 父 类 之 间 ， 第 二 、 重 
写 一 一 子 类 重 写 了 父 类 的 方法 。 

下 面 通过 一 个 示例 解释 什么 是 多 态 。 如 图 11-2 所 示 ， 父 类 Figure (几何 图 形 ) 有 一 个 
draw (绘图 ) 函数 ，Figure (几何 图 形 ) 有 两 个 子 类 Ellipse (椭圆 形 ) 和 Triangle (三 角形 )， 
Ellipse 和 Triangle 重 写 draw() 方法 。Ellipse 和 Triangle 都 有 draw() 方法 ， 但 具体 实现 的 方 
式 不 同 。 

具体 代码 如 下 : 


class Figure: 
d 上 
def draw(self) : rawlself) 
Print (' 绘制 Figure...') 


# 椭圆 形 Ellipse Triangle 
class Ellipse (Figure): 
def draw(self): 

print (' 绘制 Ellipse...') 图 11-2 几何 图 形 类 图 


“draw(self) 一 draw(self) 


# 三 角形 
class Triangle (Figure): 
def draw(self): 
print (' 绘制 Triangle...') 


fl = Figure() (0) 
fl.draw() 


f2 = Ellipse() @ 
f2.draw() 


f3 = Triangle() @ 
f3.draw() 


输出 结果 如 下 : 


绘制 Figure... 
绘制 Ellipse... 
绘制 Triangle... 


上 述 代 码 第 @ 行 和 第 @@ 行 符合 多 态 的 两 个 前 提 ， 因 此 会 发 生 多 态 。 而 代码 第 中 行 不 符合 ， 
没有 发 生 多 态 。 多 态 发 生 时 ，Python 解释 器 根据 引用 指向 的 实例 调用 它 的 方法 。 


提示 : 与 Java 等 静态 语言 相 比 ， 多 态 性 对 于 动态 语言 Python 而 言 意义 不 大 。 多 态 性 优势 
在 于 运行 期 动态 特性 。 例 如 在 Java 中 多 态 性 是 指 ， 编 译 期 声明 变量 是 父 类 的 类 型 ， 在 运行 期 
确定 变量 所 引用 的 实例 。 而 Python 不 需要 声明 变量 的 类 型 ， 没 有 编译 ， 直 接 由 解释 器 运行 ， 
运行 期 确定 变量 所 引用 的 实例 。 


11.6.2 ”类 型 检查 
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无 论 多 态 性 对 Python 影响 多 大 ，Python 作为 面向 对 象 的 语言 多 态 性 是 存在 的 ， 这 一 点 可 
以 通过 运行 期 类 型 检查 证 实 ， 运 行 期 类 型 检查 使 用 isinstance(object, classinfo) 函数 ， 它 可 以 检 
查 object 实例 是 否 由 classinfo 类 或 classinfo 子 类 所 创建 的 实例 。 


在 11.6.1 节 示 例 基础 上 修改 代码 如 下 : 


# 几何 图 形 
class Figure: 
def draw (self): 


Print(' 绘制 Figure...') 


# 椭圆 形 


class Ellipse (Figure): 


def draw(self): 


print (' 绘制 Ellipse...') 


# 三 角形 


class Triangle (Figure): 


def draw(self): 


print(' 绘制 Triangle...') 


fl = Figure() 
fl.draw() 


f2 = Ellipse() 
f2.draw() 


f3 = Triangle() 
f3.draw() 


print (isinstance (fl， 
print (isinstance (f2, 
print (isinstance (f3, 
print (isinstance (f2, 


Triangle)) 
Triangle)) 
Triangle)) 
Figure)) 


Bb 


ba 


ba 


# 
# 
# 
# 


没有 发 生 多 态 


发 生 多 态 


发 生 多 态 


False [0 
False 

True 

True @ 


上 述 代 码 第 @@ 行 和 第 @@ 行 添加 的 代码 ， 需 要 注意 代码 第 @@ 行 的 isinstance(f2, Figure) 表 
达 式 是 True， 亿 是 Ellipse 类 创建 的 实例 ，Ellipse 是 Figure 类 的 子 类 ， 所 以 这 个 表达 式 返 回 
True， 通 过 这 样 的 表达 式 可 以 判断 是 否 发 生 了 多 态 。 另 外 ， 还 有 一 个 类 似 于 isinstance(object,， 
classinfo) 的 issubclass(class, classinfo) 函数 ，issubclass(class, classinfo) 函数 用 来 检查 class 是 
否 是 classinfo 的 子 类 。 示 例 代码 如 下 : 


print (issubclass (Ellipse, 
print (issubclass (Ellipse, 
print (issubclass (Triangle, Ellipse)) 


11.6.3 ”鸭子 类 型 


Triangle)) 
Figure)) 


# 
# 
# 


False 
True 


False 


多 态 性 对 于 动态 语言 意义 不 是 很 大 ， 在 动态 语言 中 有 一 种 类 型 检查 称 为 “鸭子 类 型 ”， 即 
一 只 鸟 走 起 来 像 鸭 子 、 游 起 泳 来 像 鸡 子 、 叫 起 来 也 像 鸭 子 ， 那 它 就 可 以 被 当 作 鸭 子 。 鸭 子 类 型 


132 所 | Python 从 小 白 到 大 牛 


不 关注 变量 的 类 型 ， 而 是 关注 变量 具有 的 方法 。 鸭 子 类 型 像 多 态 一 样 工作 ， 但 是 没有 继承 ， 只 


要 像 “ 鸭 子 ” 一 样 的 行为 (方法 ) 就 可 以 了 。 
鸭子 类 型 示例 代码 如 下 : 
class Rnimal (object) : 


def run (self) : 
print (' 动物 跑 ...') 


class Dog (Animal): 
def run (self) : 
print (' 狗 狗 跑 ...') 


class Car: 
def run(self) : 
print (' 汽车 跑 ...') 


# 接收 参数 是 Animal OO 


def go (animal) : 
animal.run() 


go (Animal ()) 
go (Dog()) 
go (Car()) @ 


运行 结果 如 下 : 


动物 跑 . . . 
狗 狗 跑 . . . 
汽车 跑 . . . 


上 述 代码 定义 了 三 个 类 Animal、Dog 和 Car， 从 代码 和 
图 11-3 所 示 可 见 Dog 继承 了 Animal， 而 Car 与 Animal 和 
Dog 没有 任何 的 关系 ， 只 是 它们 都 有 run(0) 方法 。 代 码 第 四 
行 定 义 的 go0 函数 设计 时 考虑 接收 Animal 类 型 参数 ， 但 是 
由 于 Python 解释 器 不 做 任何 的 类 型 检查 ， 所 以 可 以 传 入 任 
何 的 实际 参数 。 当 代码 第 @ 行 给 go0 函数 传 入 Car 实例 时 ， 
它 可 以 正常 执行 。 这 就 是 “鸭子 类 型 ”。 

在 Python 这 样 的 动态 语言 中 使 用 “鸭子 类 型 ”替代 多 
态 性 设计 ， 能 够 充分 地 发 挥 Python 动态 语言 特点 ， 但 是 也 
给 软件 设计 者 带 来 了 困难 ， 对 程序 员 的 要 求 也 非常 高 。 


11.7 ”Python 根 类 一 一 object 


法 ， 本 节 重 点 介绍 如 下 两 个 方法 。 
。，_str (0): 返回 该 对 象 的 字符 串 表示 。 


。，_ eq (other): 指示 其 他 某 个 对 象 是 否 与 此 对 象 “ 相 等 ”。 


run(self) 
A 


run(self) 


Dog 


run(self) 


图 11-3 ”鸭子 类 型 类 图 


Python 所 有 类 都 直接 或 间接 继承 自 object 类 ， 它 是 所 有 类 的 “祖先 ”。object 类 有 很 多 方 


这 些 方法 都 是 需要 在 子 类 中 重 写 的 ， 下 面 就 详细 解释 一 下 它们 的 用 法 。 
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11.7.1 str 0 方法 


为 了 日 志 输 出 等 处 理 方便 ， 所 有 的 对 象 都 可 以 输出 自己 的 描述 信息 。 为 此 ， 可 以 重 写 
_str _() 方 法。 如 果 没 有 重 写 _str 0 方法 ， 则 默认 返回 对 象 的 类 名 ,以 及 内 存 地 址 等 信息 ， 
例如 下 面 的 信息 : 


<_main .Person object at 0x000001FEOF349AC8> 
下 面 看 一 个 示例 ， 在 前 面 11.5 节 介 绍 过 Person 类 ， 重 写 它 的 _ str_0 方法 代码 如 下 : 


class Person: 


def _init (self, name, age): 


self.name = name # 名 字 
self.age = age # 年 龄 

def _ str_(self): (0) 
template = 'Person [name={0}, age={1}]"' 


3 = template.format (self.name, self.age) 
return s 


person = Person('Tony', 18) 
print (person) @ 


运行 输出 结果 如 下 : 


Person [name=Tony, age=18] 


上 述 代码 第 @ 行 覆盖 _ str_() 方 法， 返回 什么 样 的 字符 串 完全 是 自 定义 的 ， 只 要 能 够 表示 
当前 类 和 当前 对 象 即 可 ， 本 例 是 将 Person 成 员 变 量 拼接 成 为 一 个 字符 串 。 代 码 第 @ 行 是 打印 
person 对 象 ，print() 函数 会 将 对 象 的 _ str 0 方法 返回 字符 串 ， 并 打印 输出 。 


11.7.2 ”对 象 比较 方法 


在 7.6.1 节 介绍 同一 性 测试 运算 符 时 ， 曾 经 介绍 过 内 容 相 等 比较 运算 符 “ == ” 一 用 来 比 
较 两 个 对 象 的 内 容 是 否 相等 。 当 使 用 运算 符 一 比较 两 个 对 象 时 ， 在 对 象 的 内 部 是 通过 _eq_0 
方法 进行 比较 的 。 

两 个 人 〈Person 对 象 ) 相等 是 指 什么 ? 是 名 字 ? 是 年 龄 ? 问题 的 关键 是 需要 指定 相等 的 规 
则 ， 就 是 要 指定 比较 的 是 哪些 实例 变量 相等 。 所 以 为 了 比较 两 个 Person 对 象 是 否 相 等 ， 则 需 
要 重 写 _eq_ 0 方法， 在 该 方法 中 指定 比较 规则 。 

修改 Person 代码 如 下 : 


class Person: 
def _init_ (self, name, age): 
self.name = name # 名 字 
self.age = age # 年 龄 


def _str (self): 
template = 'Person [name={0}, age={1}]" 
s = template.format (self.name, self.age) 


return s 
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def _eq (self, other): 


©o 


if self.name == other.name and self.age == other.age: 
return True 
else: 


return False 


pl = Person('Tony', 18) 


p2 


Person('Tony', 18) 


print(pl == p2) # True 


上 述 代 码 第 外 行 重 写 了 Person 类 eq (方法 ， 代 码 第 @ 行 是 提供 比较 规则 ， 即 只 有 
是 name 和 age 都 相等 才 认 为 是 两 个 对 象 相等 。 代 码 中 创建 了 两 个 Person 对 象 pl1 和 p2， 它 
们 具有 相同 的 name 和 age， 所 以 pl == p2 为 True。 为 了 比较 可 以 不 重 写 _ eq _() 方 法 ， 那 
么 pl ==p2 为 False。 


11.8 枚 举 类 


回 枚 举 是 用 来 管理 一 组 相关 的 有 限 个 数 常量 的 集合 ， 使 用 枚 举 可 以 提高 程序 的 可 读 性 ， 使 代 
码 更 清晰 且 更 易于 维护 。 在 Python 中 提供 枚 举 类 型 。 它 本 质 上 是 一 种 类 。 
国内 入 
大 码 看 坟 频 11.8.1 定义 枚 举 类 

在 Python 中 定义 枚 举 类 的 语法 格式 如 下 : 

class 枚 举 类 名 (enum.Enum) : 

枚 举 常量 列表 

枚 举 类 继承 自 enum.Enum 类 。 枚 举 中 会 定义 多 个 常量 成 员 。 枚 举 类 WeekDays 具体 代码 

如 下 : 


# coding=utf-8 
# 代码 文件 ，chapterll/chl1.8.1.py 


import enum 


class WeekDays (enum.Enum) : 
# 枚 举 常量 列表 
MONDAY = 1 
TUESDAY = 2 
WEDNESDAY = 3 
THURSDAY = 4 
FRIDAY = 10 @ 


day = WeekDays.FRIDAY @ 


print (day) # WeekDays.FRIDAY 


print (day.value) 


print (day.name) 
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# 10 
# FRIDAY 


输出 结果 : 


WeekDays .FRIDRY 
10 
FRIDAY 


上 述 代 码 第 中 行 是 定义 WeekDays 枚 举 类 ， 它 有 5 个 常量 成 员 ， 每 一 个 常量 成 员 值 都 需 


要 进行 初始 化 ， 见 代码 第 @@ 行 和 第 @ 行 。 代 码 第 @ 行 是 实例 化 枚 举 类 WeekDays， 该 实例 为 
FRIDAY。 注 意 枚 举 类 实例 化 与 类 不 同 ， 枚 举 类 不 能 调用 构造 方法 。 枚 举 实例 value 属性 是 返 
回 枚 举 值 ，name 属性 返回 枚 举 名 。 


提示 : 常量 成 员 值 可 以 是 任意 类 型 ， 多 个 成 员 的 值 也 可 以 相同 。 


11.8.2 ”限制 枚 举 类 
为 了 存储 和 使 用 方便 ， 枚 举 类 中 的 常量 成 员 取 值 应 该 是 整数 ， 而 且 每 一 常量 成 员 应 该 有 不 


同 的 取 值 。 为 了 使 枚 举 类 常量 成 员 只 能 使 用 整数 类 型 ， 可 以 使 用 enum.IntEnum 作为 枚 举 父 类 。 
为 了 防止 常量 成 员 值 重 复 ， 可 以 为 枚 举 类 加 上 @enum.unique 装饰 器 。 具 体 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapterll/ch11.8.2.py 


import enum 


@enum.unique 


@e 


class WeekDays (enum.IntEnum) : 
# 枚 举 常量 列表 
MONDRY = 1 
TUESDAY = 2 
WEDNESDAY = 3 # 'Wed."' 
THURSDAY = 4 
FRIDAY = 5 #1 


day = WeekDays.FRIDAY 
print (day) 


print (day.value) 


print (day.name) 


上 述 代 码 第 @ 行 是 WeekDays 枚 举 类 的 装饰 器 。 代 码 第 @ 行 是 定义 枚 举 类 WeekDays， 其 


父 类 是 enum.IntEnum。 如 果 尝 试 将 其 中 的 成 员 值 修改 为 其 他 数据 类 型 ， 或 修改 为 相同 值 ， 则 
会 发 生 异 常 。 


11.8.3 ”使 用 枚 举 类 
定义 枚 举 类 的 主要 目的 是 提高 程序 可 读 性 ， 特 别 是 在 比较 时 ， 枚 举 类 非常 实用 。 示 例 代 码 
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如 下 : 


# coding=utf-8 
# 代码 文件 : chapterll/ch11.8.3.py 


import enum 


@enum.unique 
class WeekDays (enum.IntEnum): 
# 枚 举 常量 列表 
MONDAY = 1 
TUESDAY = 2 
WEDNESDAY = 3 # 'Wed.' 
THURSDAY = 4 
FRIDAY = 5 #1 


day = WeekDays.FRIDAY 


if day == WeekDays .MONDAY: 


print(" 工作 ') 
elif day == WeekDays.FRIDAY: 
print(' 学 习 ') 


上 述 代码 第 四 行 比较 day 是 否 为 星期 一 ， 代 码 第 @ 行 比较 day 是 否 为 星期 五 。 从 中 可 见 
使 用 枚 举 成 员 要 好 于 使 用 1 和 5 这 种 无 意义 的 数值 。 


本 章 小 结 


本 章 主要 介绍 了 面向 对 象 编程 知识 。 首 先 介绍 了 面向 对 象 的 一 些 基本 概念 和 面向 对 象 三 个 
基本 特性 ， 然 后 介绍 了 类 、 对 象 、 封 装 、 继 承 和 多 态 ， 最 后 介绍 了 object 类 和 枚 举 类 。 


> 


很 多 事件 并 非 总 是 按照 人 们 自己 设计 的 意愿 顺利 发 展 ， 而 是 经 常 出 现 这 样 那样 的 异常 情况 。 
例如 ， 计 划 周 末 郊 游 时 ， 计 划 会 安排 得 满 满 的 。 计 划 可 能 是 这 样 的 : 从 家 里 出 发 一 到 达 目的 地 
一 游泳 一 烧烤 一 回 家 。 但 天 有 不 测 风云 ， 若 准备 烧烤 时 天 降 大 两 ， 这 时 只 能 终止 郊游 提前 回 家 。 
“天 降 大 十 ”是 一 种 异常 情况 ， 计 划 应 该 考虑 到 这 种 情况 ， 并 且 应 该 有 处 理 这 种 异常 的 预案 。 

为 增强 程序 的 健壮 性 ， 计 算 机 程序 的 编写 也 需要 考虑 如 何 处 理 这 些 异 常情 况 ，Python 语言 
提供 了 异常 处 理 功能 ， 本 章 介 绍 Python 异常 处 理 机 制 。 


12.1 异常 问题 举例 
为 了 学 习 Python 异常 处 理 机 制 ， 首 先 看 下 面 进行 除法 运算 的 示例 。 在 Python Shell 中 代 ! 


码 如 下 : 
>>> i = input (' 请 输入 数字 : ') (0) 


异常 处 理 


请 输入 数字 : 0 
>>> print(i) 
0 
>>> print(5 / int(i)) 
Traceback (most recent call last) : 
File "<pyshell#2>", line 1, in <module> 
print(5 / int(i)) 
ZeroDivisionError: division by zero 


上 述 代码 第 @ 行 通过 input() 函数 从 控制 台 读 取 字 符 串 ， 该 函数 语法 如 下 : 
input ([prompt]) 
prompt 参数 是 提示 字符 串 ， 可 以 省 略 。 


从 控制 台 读 取 字 符 串 0 赋值 给 i 变 量 ， 当 执行 print(S/int(D) 语句 时 ， 会 抛 出 ZeroDivisionError 
异常 ，ZeroDivisionError 是 除 0 异常 。 这 是 因为 在 数学 上 除数 不 能 为 0， 所 以 执行 表达 式 (5/a) 


会 有 异常 。 

重新 输入 如 下 字符 串 : 

>>> i = input(' 请 输入 数字 : ') 
请 输入 数字 : QNE 
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>>> print (i) 
QWE 
>>> print(5 / int(i)) 
Traceback (most recent call last): 
File "<pyshell#5>", line 1, in <module> 
print (5 / int(i)) 
ValueError: invalid literal for int() with base 10: 'QWE' 


这 次 输入 的 是 字符 串 QWE， 因 为 它 不 能 转换 为 整数 类 型 ， 因 此 会 抛 出 ValueError 异常 。 
程序 运行 过 程 中 难免 会 发 生 异常 ， 发 生 异常 并 不 可 怕 ， 程 序 员 应 该 考虑 到 有 可 能 会 发 生 这 
些 异 常 ， 编 程 时 应 处 理 这 些 异 常 ， 不 能 让 程序 终止 ， 这 才 是 健壮 的 程序 。 


12.2 异常 类 继承 层次 
Python 中 异常 根 类 是 BaseException， 异 常 类 继承 层次 如 下 所 示 。 


BaseException 
+-- SystemExit 


+-- KeyboardIinterrupt 
+-- GeneratorExit 
+-— Exception 
+-- StopIteration 
+-- StopAsyncIteration 
+-- ArithmeticError 
1 +-- FloatingPointError 
1 +-- OverflowError 
1 +-- ZeroDivisionError 
+-- AssertionError 
+-- AttributeError 
+-- BufferError 
+-- EOFError 
+-- ImportError 
+-- ModuleNotFoundError 
+-- LookupError 
1 +-- IndexError 
| +-- KeyError 
+-- MemoryError 
+-- NameError 
1 +-- UnboundLocalError 
+-- OSError 
+-- BlockingIOError 
+-- ChildProcessError 
+-- ConnectionError 
1 +-- BrokenPipeError 
1 +-- ConnectionAbortedError 
1 +-- ConnectionRefusedError 
1 +-- ConnectionResetError 
+-- FileExistsError 
+-— FileNotFoundError 


+-- InterruptedError 
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1 +-- IsADirectoryError 
1 +-- NotADirectoryError 
1 +-- PermissionError 
1 +-- ProcessLookupError 
1 +-- TimeoutError 
+-- ReferenceError 
+-- RuntimeError 
1 +-- NotImplementedError 
1 +-- RecursionError 
+-- SyntaxError 
1 +-- IndentationError 
1 +-- TabError 
+-- SystemError 
+-- TypeError 
+-- ValueError 
1 +-- UnicodeError 
1 +-- UnicodeDecodeError 
1 +-- UnicodeEncodeError 
1 +-- UnicodeTranslateError 
+-- Warning 
+-- DeprecationWarning 
+-- PendingDeprecationWarning 
+-- RuntimeWarning 
+-- SyntaxWarning 
+-- UserWarning 
+-- FutureWarning 
+-- ImportWarning 
+-- UnicodeWarning 
+-- BytesWarning 
+-- ResourceWarning 


从 异常 类 的 继承 层次 可 见 ，BaseException 的 子 类 很 多 ， 其 中 Exception 是 非 系统 退出 的 
异常 ， 它 包含 了 很 多 常用 异常 。 如 果 自 定义 异常 需要 继承 Exception 及 其 子 类 ， 不 要 直接 继承 
BaseException。 另 外 ， 还 有 一 类 异常 是 Warning，Warning 是 警告 ， 提 示 程 序 潜在 问题 。 


提示 : 从 异常 类 继承 的 层次 可 见 ，Python 中 的 异常 类 命名 主要 的 后 组 有 Exception、Error 
和 Warning， 也 有 少数 几 个 没有 采用 这 几 个 后 组 命名 的 ， 当 然 这 些 后 组 命令 的 类 都 有 它 的 含 
义 。 但 是 有 些 中 文 资料 根据 异常 类 后 组 名 有 时 翻译 为 “异常 "， 有 时 翻译 为 “错误 <”， 为 了 不 引 
起 误会 ， 本 书 将 它们 统一 为 “异常 ”， 特 殊 情 况 会 另行 说 明 。 


12.3 ”常见 异常 
Python 有 很 多 异常 ， 熟 悉 几 个 常见 异常 是 有 必要 的 ，12.3 节 就 介绍 几 个 常见 异常 。 
12.3.1 AttributeError 异常 
AttributeError 异常 试图 访问 一 个 类 中 不 存在 的 成 员 (包括 : 成 员 变量 、 属 性 和 成 员 方法 ) 
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而 引发 的 异常 。 
在 Python Shell 执行 如 下 代码 : 


>>> class Animal (object): @O 


pass 


>>> al = Animal () 
>>> al.run() [9 
Traceback (most recent call last): 
File "<pyshell#3>", line 1, in <module> 
al.run() 
AttributeError: "Rnimal' object has no attribute 'run’' 
35> 
>>> print(al.age) @ 
Traceback (most recent call last): 
File "<pyshell#4>", line 1, in <module> 
print (al.age) 
AttributeError: "Rnimal' object has no attribute "age' 
>>> 
>>> print (Animal .weight) @ 
Traceback (most recent call last): 
File "<pyshell#5>", line 1, in <module> 
print (Animal .weight) 
AttributeError: type object '‘'Animal' has no attribute 'weight' 


上 述 代码 第 Q@ 行 是 定义 Animal 类 。 代 码 第 四 行 是 试图 访问 Animal 类 的 run() 方法 ， 由 
于 Animal 类 中 没有 定义 run0) 方 法， 结果 抛 出 AttributeError 异常 。 代 码 第 @ 行 是 试图 访问 
Animal 类 的 实例 变量 (或 属性 ) age， 结 果 抛 出 AttributeError 异常 。 代 码 第 @ 行 是 试图 访问 
Animal 类 的 类 变量 weight， 结 果 抛 出 AttributeError 异常 。 


12.3.2 OSError 异常 


OSError 是 操作 系统 相关 异常 。Python 3.3 版 本 后 IOError (输入 输出 异常 ) 也 并 入 到 OSError 
异常 ， 所 以 输入 输出 异常 也 属于 OSError 异常 。 例 如 “未 找到 文件 ”或 “磁盘 已 满 ” 异 常 。 
在 Python Shell 中 执行 如 下 代码 : 


>>> f£ = open('abc.txt') 
Traceback (most recent call last): 
File "<pyshell#10>", line 1, in <module> 
上 = open('abc.txt') 


FileNotFoundError: [Errno 2] No such file or directory: "abc.txt'" 


上 述 代码 f= open('abc.txt") 是 打开 当前 目录 下 的 abc.txt 文件 ， 由 于 不 存在 该 文件 ， 所 以 抛 
出 FileNotFoundError 异常 。FileNotFoundError 属于 OSError 异常 。 


12.3.3 IndexError 异常 


IndexError 异常 是 访问 序列 元 素 时 ， 下 标 索 引 超出 取 值 范围 所 引发 的 异常 。 在 Python 
Shell 中 执行 如 下 代码 。 
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>>> code list = [125, 56, 89, 36] 

>>> code 1ist[4] 

Traceback (most recent call last): 
File "<pyshell#12>", 


code_1ist[4] 


line 1, in <module> 


IndexError: 


上 述 代码 code_list[4] 试图 访问 code_list 列表 的 第 5 个 元 素 ， 由 于 code_list 列表 最 多 只 有 
4 个 元 素 ， 所 以 会 引发 IndexError 异常 。 


12.3.4 KeyError 异常 


KeyError 异常 是 试图 访问 字典 里 不 存在 的 键 时 而 引发 的 异常 。 在 Python Shell 中 执行 如 下 
代码 : 


>>> dict1l[104] 
Traceback (most recent call last): 
File "<pyshell#14>", line 1, in <module> 
dict1l[104] 
104 


list index out of range 


KeyError: 


上 述 代码 dict1[104] 试图 访问 字典 dictl 中 键 为 104 的 值 ，104 键 在 字典 dictl 中 不 存在 ， 
所 以 会 引发 KeyError 异常 。 


12.3.5 NameError 异常 
NameError 是 试图 使 用 一 个 不 存在 的 变量 而 引发 的 异常 。 在 Python Shell 中 执行 如 下 代码 : 
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>>> Valuel 
Traceback (most recent call 
File "<pyshell#16>", line 
valuel 
NameError: name 'valuel' is 
>>> a = valuel 
Traceback (most recent call 
File "<pyshell#17>", line 


© 
last): 


1, in <module> 


not defined 

@ 
last): 
1, in <module> 


a = valuel 


NameError: name 'valuel' is not defined 


10 回 


上 述 代码 第 四 行 和 第 @@ 行 都 是 读 取 valuel 变量 值 ， 由 于 之 前 没有 创建 过 valuel， 所 以 会 
引发 NameError。 但 代码 第 @@ 行 valuel = 10 语句 却 不 会 引发 异常 ， 那 是 因为 赋值 时 ， 如 果 变 
量 不 存在 就 会 创建 它 ， 所 以 不 会 引发 异常 。 


12.3.6 TypeError 异常 


TypeError 是 试图 传 入 变量 类 型 与 要 求 的 不 符合 时 而 引发 的 异常 。 在 Python Shell 中 执行 
如 下 代码 : 


人 
>>> print(5 / i) 


>>> valuel = 
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Traceback (most recent call last) : 
File "<pyshell#20>", line 1, in <module> 
print (5 / i) 
TypeError: unsupported operand type(s) for /: 'int' and 'str' 


上 述 代 码 第 @ 行 (5 / i 表达 式 进行 除法 计算 ， 需 要 i 变量 是 一 个 数字 类 型 。 然 而 传 入 的 却 
是 一 个 字符 串 ， 所 以 引发 TypeError 异常 。 


12.3.7 ValueError 异常 


ValueError 异常 是 由 于 传 入 一 个 无 效 的 参数 值 而 引发 的 异常 。ValueError 异常 在 12.1 节 已 
经 遇 到 了 。 在 Python Shell 中 执行 如 下 代码 : 

>>> i = 'QWE" 

>>> print(5 / int(i)) @ 

Traceback (most recent call last) : 

File "<pyshell#22>", line 1, in <module> 
print(5 / int(i)) 
ValueError: invalid literal for int() with base 10: 'QWE' 


上 述 代码 第 @ 行 (5 / int(i)) 表达 式 进行 除法 计算 ， 需 要 传 入 的 变量 i 是 能 够 使 用 int() 函数 
转换 为 数字 的 参数 。 然 而 传 入 的 字符 串 'QWE' 不 能 转换 为 数字 ， 所 以 引发 了 ValueError 异常 。 


12.4 捕获 异常 


回 在 学 习 本 内 容 之 前 ， 可 以 先 考虑 一 下 ， 在 现实 生活 中 如 何 对 待 领导 布置 的 任务 呢 ? 当然 无 
非 是 两 种 ， 自 己 有 能 力 解 决 的 自己 处 理 ; 自己 无 力 解决 的 反馈 给 领导 ， 让 领导 自己 处 理 。 对 待 
人 异常 亦 是 如 此 。 当 前 函数 有 能 力 解决 ， 则 捕获 异常 进行 处 理 ， 没 有 能 力 解决 ， 则 抛 给 上 层 调 用 
者 (函数 ) 处 理 。 如 果 上 层 调用 者 还 无 力 解 决 ， 则 继续 抛 给 它 的 上 层 调用 者 。 异 常 就 是 这 样 向 
上 传递 直到 有 函数 处 理 它 。 如 果 所 有 的 函数 都 没有 处 理 该 异常 ， 那 么 Python 解释 器 会 终止 程 


序 运行 。 这 就 是 异常 的 传播 过 程 。 
12.4.1 try-except 语句 
捕获 异常 是 通过 try-except 语句 实现 的 ， 最 基本 的 try-except 语句 语法 如 下 : 


try : 
< 可 能 会 抛 出 异常 的 语句 > 
except [异常 类 型 ] : 

< 处 理 异常 > 


1) try 代码 块 

try 代码 块 中 包含 执行 过 程 中 可 能 会 抛 出 异常 的 语句 。 

2) except 代码 块 

每 个 try 代码 块 可 以 伴随 一 个 或 多 个 except 代码 块 ， 用 于 处 理 try 代码 块 中 所 有 可 能 抛 出 
的 多 种 异常 。except 语句 中 如 果 省 略 “异常 类 型 >， 即 不 指定 具体 异常 ， 则 会 捕获 所 有 类 型 的 
异常 ， 如 果 指 定 具 体 类 型 异常 ， 则 会 捕获 该 类 型 异常 ， 以 及 它 的 子 类 型 异常 。 

下 面 看 一 个 try-except 示例 。 
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# coding=utf-8 
# 代码 文件 ， chapter1l2/ch12.4.1.py 


import datetime as dt 


def read date(in date): 
try: 
date = dt.datetime.strptime (in date, '%Y-%m-%d') 


return date 


© ©@ © © 


except ValueError: 
print (' 处 理 ValueError 异常 ') 


str date = '2018-8-18" 
print(' 日 期 = {0}'.format (read date(str date))) 


上 述 代 码 第 @ 行 导入 了 datetime 模块 ，datetime 是 Python 内 置 的 日 期 时 间 模 块 。 代 码 第 @ 
行 定 义 了 一 个 函数 ， 在 函数 中 将 传 入 的 字符 串 转 换 为 日 期 ， 并 进行 格式 化 。 但 并 非 所 有 的 字符 
串 都 是 有 效 的 日 期 字符 串 ， 因 此 调用 代码 第 @ 行 的 strptime0 方法 有 可 能 抛 出 ValueError 异常 。 
代码 第 @ 行 是 捕获 ValueError 异常 。 本 例 中 的 '2018-8-18' 字符 串 是 有 效 的 日 期 字符 串 ， 因 此 不 
会 抛 出 异常 。 如 果 将 字符 串 改 为 无 效 的 日 期 字符 串 ， 如 '201B-8-18'， 则 会 打印 以 下 信息 。 


处 理 ValueError 异常 
日 期 = None 


如 果 需 要 还 可 以 获得 异常 对 象 ， 修 改 代码 如 下 : 


def read date(in date): 
try: 
date = dt.datetime.strptime (in date, '%Y-%m-%d') 
return date 
except ValueError as e: 
print(' 处 理 ValueError 异常 ') 
Print(e) 


ValueError ase 中 的 e 是 异常 对 象 ，print(e) 指令 可 以 打印 异常 对 象 ， 打 印 异 常 对 象 会 输出 
异常 描述 信息 ， 打 印信 息 如 下 : 


time data '201B-8-18' does not match format '‘'%Y-%m-%d"' 


12.4.2 ”多 except 代码 块 


如 果 try 代码 块 中 有 很 多 语句 抛 出 异常 ， 而 且 抛 出 的 异常 种 类 有 很 多 ， 那 么 可 以 在 try 后 
面 跟 有 多 个 except 代码 块 。 多 except 代码 块 语法 如 下 : 


本 天生 党 
< 可 能 会 抛 出 异常 的 语句 > 
except [ 异常 类 型 1] : 

< 处 理 异常 > 
except [ 异常 类 型 2] : 

< 处 理 异常 > 


except [异常 类 型 n] : 
< 处理 异常 > 
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在 多 个 except 代码 情况 下 ， 当 一 个 except 代码 块 捕获 到 一 个 异常 时 ， 其 他 的 except 代码 
块 就 不 再 进行 匹配 。 

注意 : 当 捕 获 的 多 个 异常 类 之 间 存 在 父子 关系 时 ， 捕 获 异 常 顺序 与 except 代码 块 的 顺序 有 
关 。 从 上 到 下 先 捕获 子 类 ， 后 捕获 父 类 ， 和 否则 子 类 捕获 不 到 。 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l2/ch12.4.2.py 


import datetime as dt 


def read date from file (filename): 
try: 
file = open (filename) 
in date = file.read() 
in date = in date.strip() 
date = dt.datetime.strptime (in date, '‘'%Y-%m-%d') 
return date 


@©O@© 6 


except ValueError as e: 
print (' 处 理 ValueError 异常 ') 
print (e) 

except FileNotFoundError as e: @ 
print (' 处 理 FileNotFoundError 异常 ') 
Print (e) 

except OSError as e: 
print (' 处 理 OSError 异常 ') 
print (e) 


date = read date from file('readme.txt') 
print(' 日 期 = {0}'.format (date)) 


上 述 代 码 通过 open() 函数 从 文件 readme.txt 中 读 取 字符 串 ， 然 后 解析 成 为 日 期 。 由 于 
Python 文件 操作 技术 还 没有 介绍 ， 读 者 先 不 要 关注 open() 函数 技术 细节 ， 只 考虑 调用 它们 的 
方法 会 抛 出 异常 就 可 以 了 。 

在 try 代 码 块 中 ， 代 码 第 @ 行 定义 函数 read_date_from file(filename) 用 来 从 文件 中 
读 取 字 符 串 ， 并 解析 成 为 日 期 。 代 码 第 @@ 行 调用 open0 函数 读 取 文 件 ， 它 有 可 能 抛 出 
FileNotFoundError 等 OSError 异常 。 如 果 抛 出 FileNotFoundError 异常 ， 则 被 代码 第 @@O 行 的 
except 捕获 。 如 果 抛 出 OSError 异常 ， 则 被 代码 第 @ 行 的 except 捕获 。 代 码 第 @ 行 file.read() 
方法 是 从 文件 中 读 取 数据 ， 它 也 可 能 抛 出 OSError 异常 。 如 果 抛 出 OSError 异常 ， 则 被 代码 第 
图 行 的 except 捕获。 代码 第 田 行 让 date.strip0) 方法 是 剔除 字符 串 前 后 空白 字符 (包括 空格 、 
制 表 符 、 换 行 和 回 车 等 字符 ) 。 代 码 第 @ 行 strptime() 方法 可 能 抛 出 ValueError 异常 。 如 果 抛 出 
则 被 代码 第 @ 行 的 except 捕获 。 

如 果 将 FileNotFoundError 和 OSError 捕获 顺序 调换 ， 代 码 如 下 。 


try: 
file = open (filename) 
in date = file.read() 
in date = in date.strip() 
date = dt.datetime.strptime (in date, '%Y-%m-%d') 
return date 
except ValueError as e: 
print(' 处 理 ValueError 异常 ') 
Print(e) 
except OSError as el: 
print(' 处 理 OSError 异常 ') 
print (e) 
except FileNotFoundError as e: 
print (' 处 理 FileNotFoundError 异常 ') 
print (e) 
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那么 except FileNotFoundError as e 代 码 块 永远 不 会 进入 ，FileNotFoundError 异常 处 
理 永 远 不 会 执行 。OSError 是 FileNotFoundError 父 类 ， 而 ValueError 异 常 与 OSError 和 


FileNotFoundError 异常 没有 父子 关系 ， 捕 获 ValueError 异常 位 置 可 以 随意 放置 。 


12.4.3 ”try-except 语句 府 套 


Python 提供 的 try-except 语句 是 可 以 任意 嵌 套 的 ， 修 改 12.4.2 节 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter1l2/ch12.4.3.py 
import datetime as dt 
def read date from file (filename): 
try: 
file = open (filename) 
try: 
in_date = file.read() 
in_date = in date.strip() 
date = dt.datetime.strptime (in date, '%Y-%m-%d') 
return date 
except ValueError as e: 
print(' 处 理 ValueError 异常 ') 
print (e) 
except FileNotFoundError as e: 
print (' 处 理 FileNotFoundError 异常 ') 
print (e) 
except OSError as e: 
print (' 处 理 OSError 异常 ') 
print (e) 


date = read date from file('readme.txt') 
print(' 日 期 = {0}'.format (date)) 


@e 


四 @ 


上 述 代 码 第 @ 行 ~ 第 @ 行 是 捕获 ValueError 异常 的 try-except 语句 ， 可 见 这 个 try-except 


语句 就 嵌 套 在 捕获 FileNotFoundError 和 OSError 异常 的 try-except 语句 中 。 


程序 执行 时 如 果 内 层 抛 出 异常 ， 首 先 由 内 层 except 进行 捕获 ， 如 果 捕 获 不 到 ， 则 由 外 
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层 except 捕获 。 例 如 ， 代 码 第 @ 行 的 read0 方法 可 能 抛 出 OSError 异常 ， 该 异常 无 法 被 内 层 
except 捕获 ， 最 后 被 代码 第 @ 行 的 外 层 except 捕获 。 


注意 : try-except 不 仅 可 以 嵌 套 在 try 代码 块 中 ， 还 可 以 嵌 套 在 except 代码 块 或 finally 代 
码 块 ，finally 代码 块 后 面 会 详细 介绍 。try-except 谋 套 会 使 程序 流程 变 得 复杂 ， 如 果 能 用 多 
except 捕获 的 异常 ， 尽 量 不 要 使 用 try-except 谋 套 。 要 梳理 好 程序 的 流程 再 考虑 try-except 谋 
套 的 必要 性 。 


12.4.4 ”多重 异 常 捕获 


多 个 except 代码 块 客 观 上 提高 了 程序 的 健壮 性 ， 但 是 也 大 大 增加 了 程序 代码 量 。 有 些 异 
常 虽然 种 类 不 同 ， 但 捕获 之 后 的 处 理 是 相同 的 ， 看 如 下 代码 。 

try: 

< 可 能 会 抛 出 异常 的 语句 > 

except ValueError as e: 

< 调用 方法 methodl 处 理 > 
except OSError as el: 

< 调用 方法 methodl 处 理 > 


except FileNotFoundError as el: 


< 调用 方法 methodl 处 理 > 
三 个 不 同类 型 的 异常 ， 要 求 捕获 之 后 的 处 理 都 是 调用 method1 方法 。 是 否 可 以 把 这 些 异常 
合并 处 理 呢 ? Python 中 可 以 把 这 些 异常 放 到 一 个 元 组 中 ， 这 就 是 多 重 异 常 捕获 ， 可 以 帮助 解 
决 此 类 问题 。 上 述 代 码 修改 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l2/ch12.4.4.py 


import datetime as dt 


def read date from file (filename): 

trys 
file = open (filename) 
in_date = file.read() 
in date = in date.strip() 
date = dt.datetime.strptime (in date, '%Y-%m-g%d') 
return date 

except (ValueError, OSError) as e: 
print (' 调用 方法 methodl 处 理 ...') 
print (e) 


代码 中 (ValueError, OSError) 就 是 多 重 异常 捕获 。 


注意 : 有 的 读者 会 问 为 什么 不 写成 (ValueError, FileNotFoundError, OSError) 呢 ? 这 是 因 
为 FileNotFoundError 属于 OSError 异常 ，OSError 异常 可 以 捕获 它 的 所 有 子 类 异常 了 。 
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12.5 “异常 堆栈 跟踪 


有 时 从 程序 员 的 角度 需要 知道 更 加 详细 的 异常 信息 时 ， 可 以 打印 堆栈 跟踪 信息 。 堆 栈 跟 踪 加 
信息 可 以 通过 Python 内 置 模块 traceback 提供 的 print_exc() 函数 实现 ，print_exc() 函数 的 语法 
格式 如 下 : a 


traceback.print exc (limit=None, file=None, chain=True) 


其 中 ， 参 数 limit 限制 堆栈 跟踪 的 个 数 ， 默 认 None 是 不 限制 ;参数 file 判断 是 否 输出 堆栈 跟踪 
信息 到 文件 ， 默 认 None 是 不 输出 到 文件 ， 参 数 chain 为 True， 则 将 _cause _ 和 _ context _ 
等 属性 串联 起 来 ， 就 像 解释 器 本 身 打 印 未 处 理 异 常 一 样 打印 。 

堆栈 跟踪 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 chapterl2/ch12.5.py 


import datetime as dt 
import traceback as tb @ 


def read date from file (filename) : 

try: 
file = open (filename) 
in date = fle.read() 
in date = in date.strip() 
date = dt.datetime.strptime (in date, '%Y-%m-%d') 
return date 

except (ValueError, OSError) as e: 
print (' 调用 方法 methodl 处 理 ...') 
tb.print_ exc() @ 


date = read date from file('readme.txt') 

print(' 日 期 = {0}'.format (date)) 

上 述 代码 第 @ 行 tb.print_exc( 语句 是 打印 异常 堆栈 信息 ，print_exc() 函数 使 用 了 traceback 
模块 ， 因 此 需要 在 文件 开始 导入 traceback 模块 。 

发 生 异 常 ， 输 出 结果 如 下 : 


Traceback (most recent call last): 


日 期 = None 
File "C:/Users/tony/PycharmProjects/HelloProj/ch1l2.4.4.py", line 12, in read_ 
date_from file O 
date = dt.datetime.strptime (in date，'sY-sm-sd') ©@ 


File "C:\Python\Python36\1ib\ strptime.py", line 565, in _strptime datetime 
tt, fraction = _strptime (data string, format) 
File "C:\Python\Python36\1ib\ strptime.py", line 362, in _strptime 
(data_string, format)) 
ValueError: time data '201B-8-18' does not match format '%Y-Sm-g%d' 


堆栈 信息 从 上 往 下 为 程序 执行 过 程 中 函数 (或 方法 ) 的 调用 顺序 ， 其 中 的 每 一 条 信息 明 
确 指出 了 哪 一 个 文件 ( 见 代码 第 @ 行 的 ch12.4.4.py)、 哪 一 行 ( 见 代码 第 @ 行 的 line 12)、 调 
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用 哪个 函数 或 方法 ( 见 代码 第 @ 行 的 line 12) 。 程 序 员 能 够 通过 堆栈 信息 很 快 定位 程序 哪里 
出 了 问题 。 


提示 : 在 捕获 到 异常 之 后 ， 通 过 print exc0 函数 打印 异常 堆栈 跟踪 信息 ， 往 往 只 是 用 于 调试 ， 
给 程序 员 提 示 信 息 。 扒 栈 跟 踪 信 息 对 最 终 用 户 是 没有 意义 的 ， 本 例 中 如 果 出 现 异 常 很 有 可 能 是 用 
户 输入 的 日 期 无 效 。 捕 获 到 异常 之 后 应 该 给 用 户 弹 出 一 个 对 话 框 ， 提 示 用 户 和 输入 日 期 无 效 ， 请 用 
户 重 新 输入 ， 用 户 重新 输入 后 再 重新 调用 上 述 函 教 。 这 才 是 捕获 异常 之 后 的 正确 处 理 方案 。 


12.6 ”释放 资源 


有 时 try-except 语句 会 占用 一 些 资源 ， 如 打开 文件 、 网 络 连接 、 打 开 数 据 库 连 接 和 使 用 数 
据 结果 集 等 ， 这 些 资 源 不 能 通过 Python 的 垃圾 收集 器 回收 ， 需 要 程序 员 释放 。 为 了 确保 这 些 
资源 能 够 被 释放 ， 可 以 使 用 finally 代码 块 或 with as 自动 资源 管理 。 


12.6.1 finally 代码 块 
try-except 语句 后 面 还 可 以 跟 有 一 个 finally 代码 块 ，try-except-finally 语句 语法 如 下 : 


try : 
< 可 能 会 抛 出 异常 的 语句 > 
except [ 异常 类 型 1] : 

< 处 理 异常 > 
except [ 异常 类 型 2] : 

< 处 理 异常 > 


回 
扫 码 看 视频 


except [ 异常 类 型 n] : 
< 处 理 异常 > 
finally 
< 释放 资源 > 


无 论 try 正常 结束 还 是 except 异常 结束 都 会 执行 finally 代 全 
码 块 ， 如 图 12-1 所 示 。 1 < 可 能 会 抛 出 异常 的 语句 > 
使 用 finally 代码 块 示例 代码 如 下 : except | 异常 类 型 | : 
< 处 理 异常 > 有 
# coding=utf-8 except [异常 类 型 2] : 
# 代码 文件 chapterl2/ch12.6.1.py < 处 理 异常 > I 


import datetime as dt except [异常 类 型 n] ; 
< 处 理 异常 > 


He 


def read date from file (filename): ina: 
< 释放 资源 > 
trys 
file = open (filename) 
in date = file.read() 图 12-1 finally 代码 块 流程 
in_date = in_date.strip() 


date = dt.datetime.strptime (in date, '%Y-%m-%d') 
return date 

except ValueError as e: 
print (' 处 理 ValueError 异常 ') 
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except FileNotFoundError as e: 

print(' 处 理 FileNotFoundError 异常 ') 
except OSError as e: 

print (' 处 理 OSError 异常 ') 
finally: 

file.close() 


@ 日 


date = read date from file('readme.txt') 
print(' 日 期 = {0}'.format (date)) 


上 述 代 码 第 @ 行 是 finally 代码 块 ， 在 这 里 通过 关闭 文件 释放 资源 ， 见 代码 第 @ 行 file. 
close() 的 关闭 文件 。 上 述 代码 还 是 存在 问题 的 ， 如 果 在 执行 open(filename) 打开 文件 时 ， 即 便 
抛 出 了 异常 也 会 执行 finally 代码 块 。 执 行 file.close() 关闭 文件 会 抛 出 如 下 异常 。 


Traceback (most recent call last): 
File "C:/Users/tony/PycharmProjects/HelloProj/ch12.6.1.py", line 24, in <module> 
date = read date from file('readme.txt') 
File "C:/Users/tony/PycharmProjects/HelloProj/ch1l2.6.1.py", line 21, in read_ 
date_ from file 
file.close() 


UnboundLocalError: local variable 'file' referenced before assignment 


UnboundLocalError 异常 是 NameError 异常 的 子 类 ， 异 常 信息 提示 没有 找到 file 变量 ， 
这 是 因为 open(filename) 打开 文件 失败 ， 所 以 file 变量 没有 被 创建 。 事 实 上 file.close() 关 
闭 的 前 提 是 文件 已 经 成 功 打 开 。 为 了 解决 此 问题 可 以 使 用 else 代码 块 。 


12.6.2 else 代码 块 


与 while 和 for 循环 类 似 ,try 语句 也 可 以 带 有 else 代码 块 ， ty: 
它 是 在 程序 正常 结束 时 执行 的 代码 块 ， 程 序 流程 如 图 12-2 所 示 。 [人 "可 能 会 雍 出 异常 的 语句 > 
12.6.1 节 示例 问题 可 以 使 用 else 代码 块 解决 ， 修 改 12.6.1 Sept Beal 


< 处 理 异常 > 
节 示 例 代码 如 下 : except [异常 类 型 2] : 
# coding=utf-8 MN 
# 代码 文件 ，chapterl2/ch12.6.2.py ee 异常 类 型] : 
< 处 理 异常 > lm >| 
import datetime as dt else : 
< 执行 语句 > 
def read date from file (filename) : = 
try: finally : 
file = open (filename) @ < 释放 资源 > 
except OSError as e: 
print (' 打开 文件 失败 ') 图 49.2 die 代码 类 流程 
else: ©® 
print (' 打开 文件 成 功 ') 
try: 


in date = file.read() 
in date = in date.strip() 


date = dt.datetime.strptime (in date, '%Y-%m-%d') 
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return date 
except ValueError as e: 
print(' 处 理 ValueError 异常 ') 
except OSError as e: 
print (' 处 理 OSError 异常 ') 
finally: @ 
file.close() 


date = read date from file('readme.txt') 
print(' 日 期 = {0}'.format (date)) 


上 述 代码 中 open(filename) 语句 单独 放 在 一 个 ty 中 ， 见 代码 第 @@ 行 。 如 果 正 常 打开 文 件 ， 
程序 会 执行 else 代码 块 ， 见 代码 第 @ 行 。else 代码 块 中 嵌 套 了 try 语句 ， 在 这 个 try 代码 中 读 
取 文 件 内 容 和 解析 日 期 ， 最 后 在 嵌 套 try 对 应 的 finally 代码 块 中 执行 file.close() 关闭 文件 。 


12.6.3 ”with as 代码 块 自动 资源 管理 


12.6.2 节 示 例 的 程序 虽然 “健壮 ”， 但 程序 流程 比较 复杂 ， 这 样 的 程序 代码 难以 维护 。 为 
此 Python 提供 了 一 个 with as 代码 块 帮助 自动 释放 资源 ， 它 可 以 蔡 代 finally 代码 块 ， 优 化 代码 
结构 ， 提 高 程序 可 读 性 。with as 提供 了 一 个 代码 块 ， 在 as 后 面 声明 一 个 资源 变量 ， 当 with as 
代码 块 结束 之 后 自动 释放 资源 。 

示例 代码 如 下 : 

# coding=utf-8 

# 代码 文件 : chapter1l2/ch12.6.3.py 


import datetime as dt 


def read date from file (filename): 
trys 
with open (filename) as file: [0) 


in date = file.read() 


in date = in date.strip() 
date = dt.datetime.strptime (in date, '%Y-%m-%d') 
return date 
except ValueError as e: 
print (' 处 理 ValueError 异常 ') 
except OSError as e: 


print (' 处 理 OSError 异常 ') 


date = read date from file('readme.txt') 
print(' 日 期 = {0}'.format (date)) 


上 述 代 码 第 @ 行 是 使 用 with as 代码 块 ，with 语句 后 面 的 open(filename) 语句 可 以 创建 资 
源 对 象 ， 然 后 赋值 给 as 后 面 的 file 变量 。 在 with as 代码 块 中 包含 了 资源 对 象 相关 代码 ， 完 成 
后 自动 释放 资源 。 采 用 了 自动 资源 管理 后 不 再 需要 finally 代码 块 ， 不 需要 自己 释放 这 些 资 源 。 
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注意 : 所 有 可 以 自动 管理 的 资源 ， 需 要 实现 上 下 文 管理 协议 (Context Management Protocol)。 


12.7 ” 自 定义 异常 类 


有 些 公司 为 了 提高 代码 的 可 重用 性 ， 自 己 开发 了 一 些 Python 类 库 ， 其 中 有 自己 编写 的 一 ， 
些 异 常 类 。 实 现 自 定义 异常 类 需要 继承 Exception 类 或 其 子 类 。 
实现 自 定义 异常 类 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapterl2/ch12.7.py 


class MyException (Exception): 
def _init (self, message): (0) 
super()._init (message) @ 


上 述 代 码 实 现 了 自 定义 异常 ， 代 码 第 @ 行 是 定义 构造 方法 类 ， 其 中 的 参数 message 是 异常 
描述 信息 。 代 码 第 @ 行 super0. init (message) 是 调用 父 类 构造 方法 ， 并 把 参数 message 传 入 
给 父 类 构造 方法 。 自 定义 异常 就 是 这 样 简单 ， 只 需要 提供 一 个 字符 串 参数 的 构造 方法 就 可 以 了 。 


12.8 显 式 抛 出 异常 


本 节 之 前 读者 接触 到 的 异常 都 是 由 系统 生成 的 ， 当 异常 抛 出 时 ， 系 统 会 创建 一 个 异常 对 [ 
象 ， 并 将 其 抛 出 。 但 也 可 以 通过 raise 语句 显 式 抛 出 异常 ， 语 法 格式 如 下 : 


raise BaseException 或 其 子 类 的 实例 
显 式 抛 出 异常 的 目的 有 很 多 ， 例 如 不 想 某 些 异 常 传 给 上 层 调 用 者 ， 可 以 捕获 之 后 重新 显 式 


抛 出 另外 一 种 异常 给 调用 者 。 
修改 12.4 节 示 例 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapterl2/ch12.8.py 


import datetime as dt 
class MyException (Exception): 
def _init (self, message): 


super()._init (message) 


def read date from file (filename): 


3 3 
file = open (filename) 
in date = file.read() 
in date = in date.strip() 


date = dt.datetime.strptime (in date, '%Y-%m-%d') 
return date 
except ValueError as e: 


raise MyException(' 不 是 有 效 的 日 期 ') O 
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except FileNotFoundError as e: 
raise MyException(' 文件 找 不 到 ') 
except OSError as e: 


raise MyException(' 文件 无 法 打开 或 无 法 读 取 ') @ 


date = read date from file('readme.txt') 
print(' 日 期 = {0}'.format (date)) 


如 果 软 件 设计 者 不 希望 read_date_from file() 函数 中 捕获 的 ValueError、 FileNotFoundError 
和 OSError 异常 出 现在 上 层 调 用 者 中 ， 那 么 可 以 在 捕获 到 这 些 异 常 时 ， 通 过 raise 语句 显 式 抛 
出 一 个 异常 ， 见 代码 第 @@ 和 @ 行 显 式 抛 出 自 定义 的 MyException 异常 。 

注意 : raise 显 式 抛 出 的 异常 与 系统 生成 并 抛 出 的 异常 在 处 理 方式 上 没有 区 别 ， 就 是 两 种 方 
法 ， 要 么 捕获 自己 处 理 ， 要 么 抛 出 给 上 层 调 用 者 。 


本 章 小 结 


本 章 介绍 了 Python 异常 处 理 机 制 ， 其 中 包括 Python 异常 类 继承 层次 、 捕 获 异常 、 释 放 资 
源 、 自 定义 异常 类 和 显 式 抛 出 异常 。 


第 13 章 


常用 模块 


2 


Python 官方 提供 了 数量 众多 的 模块 ， 称 为 内 置 模块 ， 本 书 不 再 一 一 介绍 。 本 章 归 纳 了 


Python 中 一 些 在 日 常 开发 过 程 中 


官方 的 API 文档 。 


13.1 math 模块 


Python 官方 提供 math 模块 进行 数学 运算 ， 如 指数 、 对 数 、 平 方 根 和 三 角 函 数 等 运算 。 
math 模块 中 的 函数 只 是 整数 和 浮 点 ， 不 包括 复数 ， 复 数 计算 需要 使 用 cmath 模块 。 


13.1.1 舍 人 函数 


ph 常用 的 模块 ， 至 于 其 他 的 不 常用 类 读者 可 以 自己 查询 Python 


math 模块 提供 的 舍 入 函数 有 math.ceil(a) 和 math.floor(a)，math.ceil(a) 用 来 返回 大 于 或 等 
于 a 的 最 小 整数 ，math.floor(a) 返回 小 于 或 等 于 a 的 最 大 整数 。 另 外 Python 还 提供 了 一 个 内 置 
函数 round(a)， 该 函数 用 来 对 a 进行 四 舍 五 入 计算 。 

在 Python Shell 中 运行 示例 代码 如 下 : 


>>> import math 


>>> math.ceil (1. 


>>> math.floor (1. 


1 
>>> round(1.4) 
1 


>>> math.ceil(1. 


>>> math.floor (1. 


>>> round(1.5) 


>>> math.floor (1. 


1 


>>> math.ceil (1. 


>>> round(1.6) 


4) 


4) 
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13.1.2” 需 和 对 数 函 数 


math 模块 提供 的 寡 和 对 数 函数 如 下 所 示 。 

*。 对 数 运算 : math.log(a[, base]) 返回 以 base 为 底 的 a 的 对 数 ， 省 略 底数 base， 是 a 的 自 
然 数 对 数 。 

。 平 方 根 : math.sqrt(a) 返回 a 的 平方 根 。 

。 备 运算 : math.pow(a, b) 返回 a 的 b 次 寡 的 值 。 

在 Python Shell 中 运行 示例 代码 如 下 : 

>>> import math 

>>> math.1og(8，2) 

3.0 

>>> math.pow(2, 3) 

8.0 

>>> math.log(8) 

2.0794415416798357 


>>> math.sqrt (1.6) 
1.2649110640673518 


13.1.3 三角 函数 


math 模块 中 提供 的 三 角 函数 有 如 下 几 种 。 

。math.sin(a): 返回 弧度 a 的 三 角 正 弦 。 

。math.cos(a): 返回 弧度 a 的 三 角 余 弦 。 

。math.tan(a): 返回 弧度 a 的 三 角 正 切 。 

。math.asin(a); 返回 弧度 a 的 反正 弦 。 

。，math.acos(a): 返回 弧度 a 的 反 余弦 。 

。math.atan(a): 返回 弧度 a 的 反正 切 。 

上 述 函 数 中 a 参数 是 弧度 。 有 了 时 需要 将 弧度 转换 为 角度 ， 或 将 角度 转换 为 弧度 ，math 模 
块 中 提供 了 弧度 和 角度 函数 。 

。math.degrees(a): 将 弧度 a 转换 为 角度 。 

。math.radians(a): 将 角度 a 转换 为 弧度 。 

在 Python Shell 中 运行 示例 代码 如 下 : 

>>> import math 

>>> math.degrees(0.5 * math.pi) 

90.0 

>>> math.radians (180 / math.pi) 

pi 

>>> a = math.radians (45 / math.pi) 


>>> a 
0.25 


>>> math.sin(a) 
0.24740395925452294 

>>> math.asin (math.sin(a)) 
0.25 
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>>> math.asin(0.2474) 
0.24999591371483254 

>>> math.asin(0.24740395925452294) 
0.25 


>>> math.cos (a) 
0.9689124217106447 

>>> math.acos (0.9689124217106447) 
0.2500000000000002 

>>> math.acos (math.cos (a)) 
0.2500000000000002 


>>> math.tan(a) 
0.25534192122103627 

>>> math.atan (math.tan (a)) 

0.25 

>>> math.atan (0.25534192122103627 
0.25 


上 述 代码 第 @ 行 的 degrees() 函数 将 弧度 转换 为 角度 ， 其 中 math.pi 是 数学 常量 Xx。 代码 第 
@ 行 的 radians0 函数 将 角度 转换 为 弧度 。 代 码 第 @ 行 math.radians(45 / math.pi) 表达 式 是 将 45 
角度 转换 为 0.25 弧度 。 


13.2 random 模块 


random 模块 提供 了 一 些 生 成 随机 数 函 数 ， 相 关 函 数 见 下 述 。 
。random.random(): 返回 在 范围 大 于 或 等 于 0.0， 且 小 于 1.0 内 的 随机 浮 点 数 。 局 
"random.randrange(stop): 返回 在 范围 大 于 或 等 于 0， 且 小 于 stop 内 ， 步 长 为 1 的 随机 整数 。 频 
。Iandom.randrange(start, stop[, step]) : 返回 在 范围 大 于 或 等 于 start， 且 小 于 stop 内 ， 步 

长 为 step 的 随机 整数 。 
"Iandom.randint(a, b): 返回 在 范围 大 于 或 等 于 a， 且 小 于 或 等 于 b 之 间 的 随机 整数 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter12/ch13.2.py 


import random 


# 0.0 <= x < 1.0 随机 数 
print('0.0 <= x < 1.0 随机 数 ') 
for i in range(0, 10): 
x = random.random() (0 


print (x) 


# 0 <= x < 5 随机 数 
print('0 <= x < 5 随机 数 ') 
for i in range(0，10) : 


x = random.randrange (5) [@) 
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print (x, end=" ') 


# 5 <= x < 10 随机 数 

print () 

print('5 <= x < 10 随机 数 ') 

for i in range(0, 10): 
x = random.randrange (5, 10) @ 
print (x, end=' ') 


# 5 <= x <= 10 随机 数 
print() 
print('5 <= x <= 10 随机 数 ') 
for i in range(0, 10): 
x = random.randint (5, 10) @ 
Print(x，end=' ') 


运行 结果 如 下 : 


.0 <= x < 1.0 随机 数 

14679067744719398 © 
5376298257414011 
35184111423811737 
5563606040766139 
16577538496133093 
05700144637207416 
37028445782666264 
5922162613642523 
9030691129412981 
4284071290039221 
<= x < 5 随机 数 
444212403 [) 
<= x < 10 随机 数 
998767658 
<= x <= 10 随机 数 
075106109786 @ 


上 述 代码 第 @ 行 调用 了 random0 函数 产生 10 个 大 于 或 等 于 0.0 小 于 1.0 的 随机 浮 点 数 。 
生成 结果 见 代码 第 @ 行 和 第 @ 行 。 

代码 第 @ 行 调用 了 randrange() 函数 产生 10 个 大 于 或 等 于 0 小 于 5 的 随机 整数 。 生 成 结果 
见 代 码 第 @ 行 。 

代码 第 @ 行 调用 了 randrange() 函数 产生 10 个 大 于 或 等 于 5 小 于 10 的 随机 整数 。 生 成 结 
果 见 代码 第 @ 行 。 

代码 第 @ 行 调用 了 randint0 函数 产生 10 个 大 于 或 等 于 5 小 于 或 等 于 10 的 随机 整数 。 生 成 
结果 见 代 码 第 @ 行 。 


@ 


baomwmnocoooooooooocooo 
© 


13.3 datetime 模块 


首 Python 官方 提供 的 日 期 和 时 间 模 块 主要 有 time 和 datetime 模块 。time 偏重 于 底层 平台 ， 
担 码 看 视频 模块 中 大 多 数 函 数 会 调用 本 地 平台 上 的 C 链接 库 ， 因 此 有 些 函 数 运行 的 结果 ， 在 不 同 的 平台 
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上 会 有 所 不 同 。datetime 模块 对 time 模块 进行 了 封装 ， 提 供 了 高 级 API， 因 此 本 章 重点 介绍 
datetime 模块 。 

datetime 模块 中 提供 了 以 下 几 个 类 。 

。datetime: 包含 时 间 和 日 期 。 

。date: 只 包含 日 期 。 

"time: 只 包含 时 间 。 

"timedelta: 计算 时 间 跨 度 。 

。tzinfo: 时 区 信息 。 


13.3.1 datetime、date 和 time 类 


datetime 模块 的 核心 类 是 datetime、date 和 time 类 ， 本 节 介绍 如 何 创建 这 三 种 不 同类 的 对 象 。 
1) datetime 类 
一 个 datetime 对 象 可 以 表示 日 期 和 时 间 等 信息 ， 创 建 datetime 对 象 可 以 使 用 如 下 构造 方法 : 


datetime .datetime (Year， month， day， hour=0, minute=0, second=0, microsecond=0, 


tzinfo=None) 


其 中 的 year、month 和 day 三 个 参数 是 不 能 省 略 的 ，tzinfo 是 时 区 参数 ， 默 认 值 是 None 
表示 不 指定 时 区 ; 除了 tzinfo 外 ， 其 他 的 参数 全 部 为 合理 范围 内 的 整数 。 这 些 参数 的 取 值 范围 
如 表 13-1 所 示 ， 注 意 如 果 超 出 这 个 范围 会 抛 出 ValueError。 


表 13-1 参数 取 值 范围 


参数 取 值 范围 说 明 
year datetime.MINYEAR < year < datetime.MAXYEAR 人 
month 1 < month < 12 
day 1 < day < 给 定年 份 和 月 份 时 ， 该 月 的 最 大 天 数 注意 闭 年 2 月 是 比较 特殊 的 有 29 天 
hour 0 < hour <24 
minute 0 < minute < 60 
second 0 second<60 
microsecond | 0 < microsecond < 1000000 


在 Python Shell 中 运行 示例 代码 如 下 : 


>>> import datetime [0 
>>> dt = datetime.datetime (2018, 2, 29) @ 
Traceback (most recent call last) : 

File "<pyshell#24>", line 1, in <module> 

dt = datetime.datetime (2018, 2, 29) 

ValueError: day is out of range for month 
>>> dt = datetime.datetime (2018, 2, 28) 
>>> dt 
datetime.datetime (2018, 2, 28, 0, 0) 
>>> dt = datetime.datetime (2018, 2, 28, 23, 60, 59, 10000) 回 


Traceback (most recent call last) : 


File "<pyshell#27>", line 1, in <module> 
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dt = datetime.datetime (2018, 2, 28, 23, 60, 59, 10000) 
ValueError: minute must be in 0..59 

>>> dt = datetime.datetime (2018, 2, 28, 23, 30, 59, 10000) 
>>> dt 

datetime.datetime (2018, 2, 28, 23, 30, 59, 10000) 


在 使 用 datetime 时 需要 导入 模块 ， 见 代码 第 四 行 。 代 码 第 @ 行 试图 创建 datetime 对 象 ， 由 
于 天 数 29 超出 范围 ， 因 此 发 生 ValueError 异常 。 代 码 第 @ 行 也 会 发 生 ValueError 异常 ， 因 为 
minute 参数 超出 范围 。 

除了 通过 构造 方法 创建 并 初始 化 datetime 对 象 ， 还 可 以 通过 datetime 类 提供 的 一 些 类 方法 
获得 datetime 对 象 ， 这 些 类 方法 有 以 下 几 种 。 

。，datetime.today():; 返回 当前 本 地 日 期 和 时 间 。 

。datetime.now(tz=None) : 返回 本 地 当前 的 日 期 和 时 间 ， 如 果 参 数 tz 为 None 或 未 指定 ， 

则 等 同 于 today0。 

。datetime.utcnow(): 返回 当前 UTC ?日 期 和 时 间 。 

。 datetime. 人 romtimestamp(timestamp, tz=None) : 返回 与 UNIX 时 间 戳 2 对 应 的 本 地 日 期 和 时 间 。 

。datetime.utcfromtimestamp(timestamp): 返回 与 UNIX 时 间 惟 对 应 的 UTC 日 期 和 时 间 。 

在 Python Shell 中 运行 示例 代码 如 下 : 


>>> import datetime 

>>> datetime.datetime.today() @ 
datetime.datetime (2018，2，3，18，48，8，840671) 

>>> datetime .datetime.now() @ 
datetime.datetime(2018, 2, 3, 18, 48, 22, 507119) 

>>> datetime .datetime.utcnow() @ 
datetime.datetime(2018, 2, 3, 10, 49, 6, 763262) 

>>> datetime.datetime.fromtimestamp (999999999.999) 四 
datetime.datetime(2001, 9, 9, 9, 46, 39, 999000) 

>>> datetime.datetime.utcfromtimestamp (999999999.999) ©@ 
datetime.datetime(2001, 9, 9, 1, 46, 39, 999000) 


从 上 述 代 码 可 见 ， 如 果 没 有 指定 时 区 ，datetime.now() 和 datetime.today() 是 相同 的 ， 见 代 
码 第 @ 行 和 第 名 行 。 代 码 第 @ 行 中 datetime.utcnow() 与 datetime.today() 相 比 晚 8 个 小 时 ， 这 
些 因为 datetime.today() 获取 的 是 本 地 时 间 ， 笔 者 所 在 地 是 北京 时 间 ， 即 东 八 区 ， 本 地 时 间 比 
UTC 时 间 早 8 个 小 时 。 代 码 第 @ 行 和 第 @ 行 通过 时 间 惟 创建 datetime， 从 结果 可 见 ， 同 样 的 时 
间 玲 datetime.fromtimestamp() 比 datetime.utcfromtimestamp() 也 是 早 8 个 小 时 。 


注意 : 在 Python 语言 中 时 间 稚 单 位 是 “ 秒 ”"， 所 以 它 会 有 小 数 部 分 。 而 其 他 语言 如 Java 
单位 是 “毫秒 "， 当 跨 平 台 计 算 时 间 时 需要 注意 这 个 差别 。 


2) date 类 
一 个 date 对 象 可 以 表示 日 期 等 信息 ， 创 建 date 对 象 可 以 使 用 如 下 构造 方法 。 


@@ UTC 即 协调 世界 时 间 ， 它 以 原子 时 为 基础 ， 是 时 刻 上 尽量 接近 世界 时 的 一 种 时 间 计 量 系统 。UTC 比 GMT 
更 加 精准 ， 它 的 出 现 满足 了 现代 社会 对 于 精确 计时 的 需要 。GMT 即 格林 尼 治 标准 时 间 ， 格 林 尼 治标 准时 间 是 19 世纪 
中 叶 大 英 帝国 的 基准 时 间 ， 同 时 也 是 世界 基准 时 间 。 

回 自 UTC 时 间 1970 年 1 月 1 日 00:00:00 以 来 至 现在 的 总 秒 数 。 
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datetime.date (year, month, day) 


其 中 的 year、month 和 day 三 个 参数 是 不 能 省 略 的 ， 参 数 应 为 合理 范围 内 的 整数 ， 这 些 参 数 的 
取 值 范围 参考 表 13-1， 如 果 超 出 这 个 范围 会 抛 出 ValueError。 
在 Python Shell 中 运行 示例 代码 如 下 : 
>>> import datetime 
>>> d = datetime.date (2018, 2, 29) O 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
d = datetime.date(2018, 2, 29) 
ValueError: day is out of range for month 
>>> d = datetime.date(2018, 2, 28) 
>>> d 
datetime.date(2018, 2, 28) 


在 使 用 date 时 需要 导入 datetime 模块 。 代 码 第 @ 行 试图 创建 date 对 象 ， 由 于 2018 年 2 月 
只 有 28 天 ，29 超出 范围 ， 因 此 发 生 ValueError 异常 。 

除了 通过 构造 方法 创建 并 初始 化 date 对 象 ， 还 可 以 通过 date 类 提供 的 一 些 类 方法 获得 
date 对 象 。 

。date.today(): 返回 当前 本 地 日 期 。 

。，date.fromtimestamp(timestamp) : 返回 与 UNIX 时 间 惟 对 应 的 本 地 日 期 。 

在 Python Shell 中 运行 示例 代码 如 下 : 

>>> import datetime 

>>> datetime.date.today() 

datetime.date(2018, 2, 3) 


>>> datetime.date.fromtimestamp (999999999.999) 
datetime.date(2001, 9, 9) 


3) time 类 
一 个 time 对 象 可 以 表示 一 天 中 时 间 信息 ， 创 建 time 对 象 可 以 使 用 如 下 构造 方法 : 


datetime.time (hour=0, minute=0, second=0, microsecond=0, tzinfo=None) 


所 有 参数 都 是 可 选 的 ， 除 tzinfo 外 ， 其 他 参数 应 为 合理 范围 内 的 整数 ， 这 些 参数 的 取 值 范 
围 参考 表 13-1， 如 果 超 出 这 个 范围 会 抛 出 ValueError。 
在 Python Shell 中 运行 示例 代码 如 下 : 


>>> import datetime 
>>> datetime.time (24,59,58,1999) O 
Traceback (most recent call last) : 
File "<pyshell#19>", line 1, in <module> 

datetime.time (24,59,58,1999) 
ValueError: hour must be in 0..23 
>>> datetime.time (23, 59, 58, 1999) 
datetime.time (23, 59, 58, 1999) 


在 使 用 time 时 需要 导入 datetime 模块 。 代 码 第 @ 行 试图 创建 time 对 象 ， 由 于 一 天 时 间 不 
能 超过 24， 因 此 发 生 ValueError 异常 。 
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13.3.2 ”日 期 时 间 计 算 


如 果 想 知道 10 天 之 后 是 哪 一 天 ， 或 想 知 道 2018 年 1 月 1 日 前 5 周 是 哪 一 天 ， 就 需要 使 用 
timedelta 类 了 ，timedelta 对 象 用 于 计算 datetime、date 和 time 对 象 时 间 间 隔 。 
timedelta 类 构造 方法 如 下 : 


datetime.timedelta (days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, 


hours=0, weeks=0) 


所 有 参数 都 是 可 选 的 ， 参 数 可 以 为 整数 或 浮 点 数 ， 可 以 为 正 数 或 负数 。 在 timedelta 内 部 
只 保存 days (天 )、seconds ( 秒 ) 和 microseconds ( 微 秒 ) 变量 ， 所 以 其 他 参数 milliseconds ( 毫 
秒 )、minutes (分 钟 ) 和 weeks ( 周 ) 都 应 换算 为 days、seconds 和 microseconds 这 三 个 参数 。 

在 Python Shell 中 运行 示例 代码 如 下 : 

>>> import datetime 

>>> datetime.date.today() 

datetime.date (2018, 2, 3) 

>>> d = datetime.date.today() 

>>> delta = datetime.timedelta(10) 

>>> d += delta 

>>> d 

datetime.date(2018，2，14) 

>>> d = datetime.date(2018, 1, 1) 

>>> delta = datetime.timedelta (weeks = 5) 

>>> d -= delta 

>>> d 

datetime.date (2017, 11, 27) 


上 述 代码 第 @ 行 是 获得 当前 本 地 日 期 ， 代 码 第 @ 行 是 创建 10 天 的 timedelta 对 象 ， 代 码 第 
@ 行 d += delta 是 当前 日 期 +10 天 ; 代码 第 @ 行 是 创建 2018 年 1 月 1 日 期 对 象 ， 代 码 第 @ 行 
是 创建 5 周 的 timedelta 对 象 ; 代码 第 @ 行 4 -= delta 表示 d 前 5 周 的 日 期 。 

本 例 中 只 演示 了 日 期 的 计算 ， 使 用 timedelta 对 象 可 以 精确 到 微 秒 ， 这 里 不 再 装 述 。 


13.3.3 日 期 时 间 格 式 化 和 解析 


无 论 日 期 还 是 时 间 ， 当 显示 在 界面 上 时 ， 都 需要 进行 格式 化 输出 ， 使 它 能 够 符合 当地 人 查 
看 日 期 和 时 间 的 习惯 。 与 日 期 时 间 格 式 化 输出 相反 的 操作 为 日 期 时 间 的 解析 ， 当 用 户 使 用 应 用 
程序 界面 输入 日 期 时 ， 计 算 机 能 够 读 入 的 是 字符 串 ， 经 过 解析 这 些 字符 串 获 得 日 期 时 间 对 象 。 

Python 中 日 期 时 间 格 式 化 使 用 strftime0 方法 ，datetime、date 和 time 三 个 类 中 都 有 一 个 
实例 方法 strftime(format) ; 而 日 期 时 间 解 析 使 用 datetime.strptime(date_string, format) 类 方法 ， 
date 和 time 没有 strptime() 方法 。 方 法 strftime() 和 strptime() 中 都 有 一 个 格式 化 参数 format， 
用 来 控制 日 期 时 间 的 格式 ， 如 表 13-2 所 示 是 常用 的 日 期 和 时 间 格 式 控制 符 。 


表 13-2 常用 的 日 期 和 时 间 格 式 控制 符 


@@e 


@@@ 


01、 02、 12 


08、 18 
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续 表 

指令 .4 示 例 

%Y 四 位 年 份 表示 2008、2018 

%d 月 内 中 的 一 天 1、 2% 3 

%H 两 位 小 时 表示 ( 24 小 时 制 ) 00、 01、 23 

%I 两 位 小 时 表示 ( 12 小 时 制 ) 01、02、12 

%p AM 或 PM 区 域 性 设置 AM 和 PM 

WM 两 位 分 钟表 示 00、 01、 59 

%S 两 位 秒表 示 00、01、59 

%f 用 6 位 数 表示 微 秒 000000，000001，…，999999 

%z +HHMM 或 -HHMM 形式 的 UTC 偏 移 +0000、-0400、+1030， 如 果 没有 设置 时 区 为 空 

%Z 时 区 名 称 UTC、EST、CST， 如 果 没 有 设置 时 区 为 空 


提示 : 表 13-2 中 的 数字 都 是 指 十 进 制 数字 。 控 制 符 会 因 不 同 平台 有 所 区 别 ， 这 是 因为 
Python 调用 了 本 地 平台 C 库 的 strftime() 函数 而 进行 了 日 期 和 时 间 格 式 化 。 事 实 上 这 些 控 制 符 
是 1989 版 C 语言 控 制 符 。 表 13-2 只 列 出 了 常用 的 控制 符 ， 更 多 控制 符 可 参考 https://docs.py- 
thon.org/3/library/datetime.html#strftime-strptime-behavior。 


在 Python Shell 中 运行 示例 代码 如 下 : 


>>> import datetime 

>>> d = datetime.datetime.today() 
>>> d.strftime('%Y-%m-%d %H:%M:%S"') 
"2018-02-04 10:40:26' 

>>> d.strftime ('%Y-%m-%d') 
'2018-02-04' 


>>> str date = '2018-02-29 10:40:26' 
>>> date = datetime.datetime.strptime (str date, '%Y-%m-%d %H:%M:%S') @ 
Traceback (most recent call last): 
File "<pyshell#57>", line 1, in <module> 
date = datetime.datetime.strptime (str date, '%Y-%m-%d %H:%M:%S') 
File "C:\Python\Python36\1ib\ strptime.py", line 565, in _strptime datetime 
tt, fraction = _strptime (data_ string, format) 
File "C:\Python\Python36\1ib\ strptime.py", line 528, in _strptime 
datetime date(year, 1, 1).toordinal() +1 


ValueError: day is out of range for month 


>>> str date = '2018-02-28 10:40:26' 
>>> date = datetime.datetime.strptime (str date, '%Y-%m-%d %H:%M:$S') 
>>> date 


datetime.datetime (2018, 2, 28, 10, 40, 26) 


>>> date = datetime.datetime.strptime (str date, '%Y-%m-%d') ® 
Traceback (most recent call last): 
File "<pyshell#61>", line 1, in <module> 
date = datetime.datetime.strptime (str date, '%Y-%m-%d') 


File "C:\Python\Python36\1ib\ strptime.py", line 565, in _strptime datetime 
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tt, fraction = strptime(data string, format) 
File "C:\Python\Python36\1ib\ strptime.py", line 365, in _strptime 
data_string[found.end():]) 


ValueError: unconverted data remains: 10:40:26 


上 述 代码 第 Q@@ 行 对 当前 日 期 时 间 d 进行 格式 化 ，d 包含 日 期 和 时 间 信 息 ， 如 果 只 关心 其 中 
部 分 信息 ， 在 格式 化 时 可 以 指定 部 分 控制 符 ， 如 代码 第 @ 行 只 是 设置 年 月 日 。 

代码 第 @ 行 试图 解析 日 期 时 间 字 符 串 str_date， 因 为 2018 年 2 月 没有 29 日 ， 所 以 解析 过 
程 会 抛 出 ValueError 异常 。 代 码 第 @ 行 设置 的 控制 符 只 有 年 月 日 ('%Y-%m-%d'")， 而 要 解析 的 
字符 串 '2018-02-28 10:40:26' 是 有 时 分 秒 的 ， 所 以 也 会 抛 出 ValueError 异常 。 


13.3.4 时 区 


datetime 和 time 对 象 只 是 单纯 地 表示 本 地 的 日 期 和 时 间 ， 没 有 时 区 信息 。 如 果 想 带 有 时 区 
信息 ， 可 以 使 用 timezone 类 ， 它 是 tzinfo 的 子 类 ， 提 供 了 UTC 偏 移 时 区 的 实现 。timezone 类 
构造 方法 如 下 : 


datetime.timezone (offset, name=None) 
其 中 offset 是 UTC 偏 移 量 ，+8 是 东 八 区 ， 北 京 在 此 时 区 ; -5 是 西 五 区 ， 纽 约 在 此 时 区 ，0 是 


零 时 区 ， 伦 敦 在 此 时 区 。name 参数 是 时 区 名 字 ， 如 Asia/Beijing， 可 以 省 略 。 
在 Python Shell 中 运行 示例 代码 如 下 : 


>>> from datetime import datetime, timezone, timedelta 


>>> utc dt = datetime(2008, 8, 19, 23, 59, 59, tzinfo= timezone.utc) @ 
>>> utc_dt 

datetime.datetime(2008, 8, 19, 23, 59, 59, tzinfo=datetime.timezone.utc) 

>>> utc dt.strftime('%Y-%m-%d %H:%M:%S %2"') @ 
"2008-08-19 23:59:59 UTC' 

>>> 

>>> utc dt.strftime('%Y-%m-%d %H:%M:%S gz') @ 


'2008-08-19 23:59:59 +0000" 


>>> bj_tz = timezone (offset = timedelta(hours = 8), name = 'Asia/Beijing') © 
>>> bj_tz 

datetime.timezone (datetime.timedelta(0, 28800), 'Asia/Beijing') 

>>> bj_dt = utc dt.astimezone (bj tz) 
>>> bj_dt 


datetime.datetime(2008, 8, 20, 7, 59, 59, tzinfo=datetime.timezone (datetime. 
timedelta(0, 28800), 'Asia/Beijing')) 

>>> bj _ dt.strftime('%Y-%m-%d %H:%M:%S %2Z"') 

"2008-08-20 07:59:59 Asia/Beijing' 

>>> bj _dt.strftime('%Y-%m-%d %H:%M:%S gSz") 

"2008-08-20 07:59:59 +0800°" 


>>> bj_tz = timezone (timedelta(hours = 8)) @ 
>>> bj dt = utc dt.astimezone (bj tz) 

>>> bj_dt.strftime('sY-sm-sd %H:%M:%S gz') 

"2008-08-20 07:59:59 +0800' 
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上 述 代码 第 @@ 行 采用 from import 语句 导入 datetime 模块 ， 并 明确 指定 导入 datetime、 
timezone 和 timedelta 类 ， 这 样 在 使 用 时 就 不 必 在 类 前 面 再 加 datetime 模块 名 了 ， 使 用 起 来 比 
较 简 洁 。 如 果 想 导入 所 有 的 类 可 以 使 用 from datetime import * 语句 。 

代码 第 @@ 行 创建 了 datetime 对 象 utc_dt，tzinfo= timezone.utc 表示 设置 UTC 时区， 相当 
于 timezone(timedelta(0))。 代 码 第 @ 行 和 第 @ 行 分 别 格式 化 输出 utc_dt， 它 们 都 分 别 带 有 时 
区 控制 符 。 

代码 第 @ 行 创建 了 timezone 对 象 bi tz，offset = timedelta(hours = 8) 表示 设置 时 区 偏 移 量 
为 东 八 区 ， 即 北京 时 间 。 实 际 参数 Asia/Beijing 是 时 区 名 ， 可 以 省 略 ， 见 代码 第 @ 行 。 完 成 时 
区 创建 还 需要 设置 具体 的 datetime 对 象 。 代 码 第 @ 行 utc_dt.astimezone(bj_tz) 是 调整 时 区 ， 返 
回 值 bj_dt 就 变 成 北京 时 间 了 。 


13.4 logging 日 志 模块 


在 程序 开发 过 程 中 ， 有 时 需要 输出 一 些 调试 信息 ; 在 程序 发 布 后 ， 有 时 需要 一 些 程序 的 运 
行 信息 ; 在 程序 发 生 错误 时 需要 输出 一 些 错误 信息 。 这 些 可 以 通过 在 程序 中 加 入 日 志 输 出 实 jj 
现 。 大 部 分 开发 人 员 会 使 用 printO 函数 进行 日 志 输出 ， 但 是 print() 函数 要 想 同时 输出 日 志 信 加 
息 和 时 间 、 所 在 函数 、 所 在 线程 等 内 容 是 比较 困难 的 。 让 print0 函数 输出 日 志 到 文件 也 是 非常 
困难 的 。 而 且 print() 函数 不 能 分 级 输出 日 志 ， 例 如 一 些 信息 是 在 调试 输出 ， 在 程序 发 布 后 ， 不 
需要 输出 这 些 信 息 ， 这 就 分 级 输出 ，print() 函数 做 不 到 这 一 点 。 

综 上 所 述 ， 要 想 满足 复杂 的 日 志 输出 需求 ， 不 能 使 用 print() 函数 ， 可 以 使 用 logging 模 
块 ， 它 是 Python 的 内 置 模 块 。 


13.4.1 日 志 级 别 


logging 模块 提供 5 种 常用 级 别 ， 如 表 13-3 所 示 。 这 5 种 级 别 从 上 到 下 由 低 到 高 。 如 果 设 
置 了 DEBUG 级 别 ，debug() 函数 和 其 他 级 别 的 函数 的 日 志 信 息 都 会 输出 ; 如果 设 置 了 ERROR 
级 别 ，error() 和 critical() 函数 的 日 志 信息 会 输出 。 


表 13-3 日 志 级 别 
日 志 级 别 说 明 
DEBUG 最 详细 的 日 志 信 息 ， 主 要 用 于 输出 调试 信息 
INFO 输出 一 些 关 键 节 点 信息 ， 用 于 确定 程序 的 流程 
A 一 些 不 期 望 的 事情 发 生 时 输出 的 信息 ( 如 磁盘 可 用 空间 较 低 ) ， 但 是 此 时 程序 还 是 
人 正常 运行 的 
ERROR 由 于 一 个 更 严重 的 问题 导致 某 些 功能 不 能 正常 运行 时 日 志 信息 


CRITICAL 发 生 严重 错误 ， 导 臻 应 用 程序 不 能 继续 运行 时 的 信息 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl9/ch19.4.4-2.py 


import logging 
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logging.basicConfig (level=logging .ERROR) @O 


1logging.debug(' 这 是 DEBUG 级 别 信息 。') 
logging.info(' 这 是 INFO 级 别 信 息 。') 
logging.warning (' 这 是 WARNING 级 别 信息 。' ) 
logging.error (' 这 是 ERROR 级 别 信息 。') 
logging.critical(' 这 是 CRITICAL 级 别 信息 。') 


输出 结果 : 


ERROR:root: 这 是 ERROR 级 别 信息 。 
CRITICRL:root : 这 是 CRITICAL 级 别 信息 。 


上 述 代码 第 @ 行 对 日 志 进 行 基本 配置 ，level=logging.ERROR 中 设置 日 志 级 别 为 FRROR 。 
如 果 改 变 日 志 级 别 为 DEBUG， 所 有 日 志 函 数 信息 都 能 输出 ， 输 出 的 结果 是 : 

DEBUG:root: 这 是 DEBUG 级 别 信息 。 

INFO:root: 这 是 INFO 级 别 信 息 。 

WARNING:root: 这 是 WARNING 级 别 信息 。 


ERROR:root: 这 是 ERROR 级 别 信息 。 
CRITICAL:root: 这 是 CRITICAL 级 别 信息 。 


在 输出 的 日 志 信息 中 会 有 root 关键 字 ， 这 说 明 进 行 日 志 输 出 的 对 象 是 root 日志 器 (log- 
ger) 。 也 可 以 使 用 getLogger() 函数 创建 自己 的 日 志 器 对 象 ， 代 码 如 下 : 


logger = logging.getLogger(_name ) 


getLogger() 函数 的 参数 是 一 个 字符 串 ， 本 例 中 name _ 是 当前 模块 名 。 使 用 自 定义 日 志 
器 的 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl3/ch13.4.1-2.py 


import logging 
logging.basicConfig (level=logging .DEBUG) 
logger = logging.getLogger(_ name ) 


logger.debug (' 这 是 DEBUG 级 别 信息 。' ) 
logger.info(' 这 是 INFO 级 别 信 息 。') 
logger.warning(' 这 是 WARNING 级 别 信息 。') 
logger.error (' 这 是 ERROR 级 别 信息 。') 
logger.critical(' 这 是 CRITICAL 级 别 信 息 。') 


输出 结果 如 下 : 


DEBUG: main : 这 是 DEBUG 级 别 信 息 。 

INFO: main _: 这 是 INFO 级 别 信 息 。 
WARNING: main _: 这 是 WARNING 级 别 信息 。 
ERROR: main : 这 是 ERROR 级 别 信息 。 
CRITICAL: main _: 这 是 CRITICAL 级 别 信息 。 
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代码 第 @ 行 是 自 定义 一 个 日 志 器 logger 对 象 ， 有 了 日 志 器 对 象 就 可 以 通过 日 志 器 调用 日 志 
函数 了 ， 见 代码 第 @ 行 。 


13.4.2 


日 志 信 息 格式 化 


可 以 根据 自己 的 需要 设置 日 志 信 息 的 格式 布局 。 常 用 的 格式 化 参数 如 表 13-4 所 示 。 
表 13-4 日 志 信 息 格 式 


日 志 格式 参数 说 明 
%(name)s 日 志 器 名 
%(asctime)s 输出 日 志 时 间 
%(filename)s 包括 路 径 的 文件 名 
%(funcName)s 函数 名 
%(levelname)s 日 志 等 级 
%(processName)s 进程 名 
%(threadName)s 线程 名 
%(message)s 输出 的 信息 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapterl3/ch13.4.2.py 


import 


logging 


logging.basicConfig (level=logging.INFO, 
format="'%(asctime)s - %(threadName)s — 
"gS (name)s - %(funcName)s - %(levelname)s - $(message)s') © 


logger 


logger. 


logger. 
logger. 
logger. 
.critical(' 这 是 CRITICAL 级 别 信 息 。') 


logger 


= logging.getLogger(_ name_) 


debug (' 这 是 DEBUG 级 别 信息 。') 
info(' 这 是 INFO 级 别 信息 。') 
warning (' 这 是 WARNING 级 别 信息 。') 
error (' 这 是 ERROR 级 别 信 息 。') 


def funlog(): 
logger.info(' 进入 funlog 函数 。') 


logger.info(' 调用 funlog 函数 。') 

funlog() 

输出 结果 如 下 : 

2018-03-24 18:08:25,972 - MainThread - _main  - <module> - INFO - 这 是 INFO 级 别 信 息 。 
2018-03-24 18:08:25,972 - MainThread - _main  - <module> - WARNING - 这 是 WARNING 级 


别 信息 。 
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2018-03-24 18:08:25,972 - MainThread - _main  - <module> - ERROR - 这 是 ERROR 级 
别 信息 。 

2018-03-24 18:08:25,972 - MainThread - _main  - <module> - CRITICAL - 这 是 CRITICAL 
级 别 信息 。 

2018-03-24 18:08:25,972 - MainThread - _ main  - <module> - INFO - 调用 funlog 函数 。 

2018-03-24 18:08:25,972 - MainThread - _main  - funlog - INFO - 进入 funlog 函数 。 


上 述 代码 第 @ 行 是 通过 basicConfigO) 函数 的 format 参数 设置 日 志 格 式 化 信息 。 从 输出 结 
果 可 见 ，%(name)s 格式 化 输出 日 志 器 名 ; %(funcName)s 格式 化 输出 函数 名 。 


13.4.3 日 志 重 定位 


日 志 信 息 默认 是 输出 到 控制 台 的 ， 也 可 以 将 日 志 信息 输出 到 日 志文 件 中 ， 甚 至 可 以 输出 到 
网 络 中 的 其 他 计算 机 。 
输出 到 日 志文 件 中 的 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter13/ch13.4.3.py 


import logging 


logging.basicConfig (level=logging.INFO, 
format='%(asctime)s - %(threadName)s - 
"$(name)s - %(funcName)s - %(levelname)s - %(message)s', 


filename='test .1o0g') (0) 


logger = logging.getLogger(_ name ) 


logger.debug (' 这 是 DEBUG 级 别 信息 。') 
logger.info(' 这 是 INFO 级 别 信 息 。') 
logger.warning(' 这 是 WARNING 级 别 信息 。') 
logger.error(' 这 是 ERROR 级 别 信息 。') 
logger.critical(' 这 是 CRITICAL 级 别 信 息 。') 


def funlog(): 
logger.info(' 进入 funlog 函数 。') 


logger.info(' 调用 funlog 函数 。') 
funlog() 


上 述 代码 第 四 行 basicConfig0O 函数 的 参数 filename='test.log'"， 是 设置 日 志文 件 名 ， 也 包括 


路 径 ， 但 是 需要 注意 的 是 ， 路 径 中 的 文件 夹 是 存在 的 。 程 序 运行 日 志 不 会 在 控制 台 输 出 ， 而 是 
写 入 当前 目录 中 的 testlog 文件 ， 默 认 情况 下 日 志 信息 是 不 断 追 加 到 文件 中 的 。 


13.4.4 ”使 用 配置 文件 


之 前 的 日 志 示例 中 ， 日 志 信 息 的 配置 都 是 在 basicConfig0 函数 中 进行 的 ， 这 样 就 不 是 很 方便 ， 
每 次 修改 日 志 配置 时 都 需要 修改 程序 代码 。 特 别 是 在 程序 发 布 后 ， 系 统 维护 人 员 要 想 修 改 代码 ， 
可 能 会 引起 严重 的 责任 问题 。 此 时 ， 可 以 使 用 配置 文件 ， 配 置信 息 可 以 从 配置 文件 中 读 取 。 
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从 配置 文件 中 读 取 的 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapter1l3/ch13.4.4.py 


import logging 
import logging.config 


logging.config.fileConfig ("logger.conf") 
logger = logging.getLogger('loggerl1') 


logger.debug (' 这 是 DEBUG 级 别 信息 。' ) 
logger.info(' 这 是 INFO 级 别 信息 。') 
logger.warning(' 这 是 WARNING 级 别 信 息 。') 
logger.error (' 这 是 ERROR 级 别 信息 。' ) 
logger.critical(' 这 是 CRITICAL 级 别 信息 。') 


def funlog(): 
logger.info(' 进入 funlog 函数 。') 


logger.info(' 调用 funlog 函数 。') 
funlog() 


代码 第 @ 行 是 指定 配置 信息 是 从 文件 logger.conf 中 读 取 的 ， 代 码 第 @ 行 是 从 配置 文件 中 
读 取 loggerl 配置 信息 创建 日 志 器 。 
配置 文件 logger.conf 代码 如 下 : 


[loggers] # 配置 日 志 器 [oy 
keys=root, simpleExample # 日 志 器 包含 了 root 和 simpleExample 


[logger_root] # 配置 根 日 志 器 

level=DEBUG 

handlers=consoleHandler # 日 志 器 对 应 的 处 理 器 
[logger_simpleExample] # 配置 simpleExample 日 志 器 
level=DEBUG 

handlers=fileHandler # 日 志 器 对 应 的 处 理 器 
qualname=loggerl # 日 志 器 名 字 

[handlers] # 配置 处 理 器 © 


keys=consoleHandler,fileHandler  # 包 含 了 两 个 处 理 器 


[handler_consoleHandler] # 配置 consoleHandler 日 志 器 
class=StreamHandler 
level=DEBUG 


formatter=simpleFormatter 


@e 


args=(sys.stdout,) 


[handler fileHandler] # 配置 fileHandler 日 志 器 
class=FileHandler 
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level=DEBUG 


formatter=simpleFormatter 


args=('test.10g','a') Q@ 
[formatters] # 配置 格式 化 器 
keys=simpleFormatter # 日 志 器 包含 simpleFormatter 
[formatter simpleFormatter] # 配置 simpleFormatter 格式 化 器 @ 


format=% (asctime)s-%(levelname)s-%(message)s 


在 配置 文件 中 需要 配置 主要 项 目 是 日 志 器 、 处 理 器 和 格式 化 器 ， 见 代码 第 四 行 、 第 @ 行 和 
第 @ 行 ， 其 中 处 理 器 就 是 指定 日 志 信 息 输出 到 哪里 ， 包 括 控制 台 、 文 件 和 网 络 等 ， 格 式 化 器 就 
是 将 日 志 信息 进行 格式 化 。 它 们 之 间 的 依赖 关系 是 ， 日 志 器 依赖 于 处 理 器 ， 处 理 器 依赖 于 格式 
化 器 。 

这 三 项 配置 又 可 以 分 为 多 个 子 配 置信 息 ， 例 如 日 志 器 可 以 分 为 root 和 simpleExample 两 
个 ， 处 理 器 有 consoleHandler 和 fileHandler 两 个 ， 格 式 化 器 只 有 simpleFormatter 一 个 。 

下 面 重点 介绍 一 下 处 理 器 。 代 码 第 @ 行 设置 处 理 器 类 是 StreamHandler， 即 输入 输出 流 处 
理 器 ， 包 括 控制 台 、 网 络 等 。 代 码 第 @ 行 设置 该 处 理 器 采用 的 格式 化 器 。 代 码 第 @ 行 设置 输出 
流 是 控制 台 。 代 码 第 @ 行 是 设置 处 理 器 类 是 FileHandler， 即 文件 处 理 器 。 代 码 第 @ 行 是 指定 
输出 文件 。 

ch13.4.4.py 代码 中 指定 的 日 志 器 名 是 loggerl， 也 就 是 配置 文件 中 的 simpleExample 日 志 
器 ， 它 依赖 的 处 理 器 是 fileHandler 日 志 器 ，fileHandler 依赖 的 格式 化 器 是 simpleFormatter。 


本 章 小 结 


通过 对 本 章 的 学 习 ， 读 者 可 以 学 习 到 math 模块 、random 模块 和 datetime 模块 。 本 章 
在 math 模块 中 介绍 了 舍 入 函数 、 究 函数、 对 数 函 数 和 三 角 函 数 ; random 模块 中 介绍 了 ran- 
dom()、randrange() 和 randint() 函数 ; datetime 模块 中 介绍 了 datetime、date 和 time 类 ， 以 及 
timedelta 和 timezone 类 ; 最 后 介绍 了 logging 日 志 模块 。 


> 


正则 表达 式 (Regular Expression， 在 代码 中 常 简写 为 regex、regexp、RE 或 re) 是 预先 定 
义 好 的 一 个 “规则 字符 串 ”， 通 过 这 个 “规则 字符 串 ” 可 以 匹配 、 查 找 和 替换 那些 符合 “规则 ” 
的 文本 。 

虽然 文本 的 查找 和 替换 功能 可 通过 字符 串 提供 的 方法 实现 ， 但 是 实现 起 来 极为 困难 ， 而 且 
运算 效率 也 很 低 。 而 使 用 正则 表达 式 实现 这 些 功能 会 比较 简单 ， 而 且 效 率 很 高 ， 唯 一 的 困难 之 
处 在 于 编写 合适 的 正则 表达 式 。 

Python 中 正则 表达 式 应 用 非常 广泛 ， 如 数据 挖掘 、 数 据 分 析 、 网 络 怜 虫 、 输 入 有 效 性 验证 
等 。Python 也 提供 了 利用 正则 表达 式 实现 文本 的 匹配 、 查 找 和 蔡 换 等 操作 的 re 模块 。 本 章 介 
绍 的 正则 表达 式 与 其 他 的 语言 正则 表达 式 是 通用 的 。 


14.1 正则 表达 式 字符 串 


正则 表达 式 是 一 种 字符 串 ， 正 则 表达 式 字符 串 是 由 普通 字符 和 元 字符 〈Metacharacters) 组 
成 的 。 

1) 普通 字符 

普通 字符 是 按照 字符 字面 意义 表示 的 字符 。 图 14-1 是 验 
证 域名 为 zhijieketang.com 的 邮箱 的 正则 表达 式 ， 其 中 标号 为 


正则 表达 式 


@ 的 字符 〔@zhijieketang 和 com) 都 属于 普通 字符 ， 这 里 它们 \W+@zhijieketang\.com 
都 表示 字符 本 身 的 字面 意义 。 下 不 不 个 
2) 元 字符 0 (2) 12) 
元 字符 是 预先 定义 好 的 一 些 特定 字符 ， 如 图 14-1 所 示 ， ”图 14-1 验证 邮箱 zhijieketang.com 
其 中 标号 为 的 字符 Mw+ 和 \.) 都 属于 元 字符 。 的 正则 表达 式 


14.1.1 元 字符 


元 字符 (Metacharacters) 是 用 来 描述 其 他 字符 的 特殊 字符 ， 它 由 基本 元 字符 和 普通 字符 构 
成 。 基 本 元 字符 是 构成 元 字符 的 组 成 要 素 。 基 本 元 字符 主要 有 14 个 ， 具 体 如 表 14-1 所 示 。 
14-1 中 “\w+ ”是 元 字符 ， 它 由 两 个 基本 元 字符 (“\” 和 “+”) 和 一 个 普通 字符 w 构 
成 。 另 外 ， 还 有 “\.” 元 字符 ， 它 由 两 个 基本 元 字符 “\” 和 “.” 构 成 。 

学 习 正则 表达 式 某 种 意义 上 讲 就 是 在 学 习 元 字符 的 使 用 ， 元 字符 是 正则 表达 式 的 重点 也 是 
难点 。 下 面 会 分 门 别 类 地 介绍 元 字符 的 具体 使 用 。 
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表 14-1 基本 元 字符 

字 符 说 明 

转 义 符 ， 表 示 转 义 

¢ 表示 任意 一 个 字符 

这 表示 重复 一 次 或 多 次 

表示 重复 零 次 或 多 次 

? 表示 重复 零 次 或 一 次 

| 选择 符号 ， 表 示 “ 或 关系 ”， 例 如 : A1B 表示 匹配 A 或 B 

{} 定义 量词 

[] 定义 字符 类 

() 定义 分 组 

^ 可 以 表示 取 反 ， 或 匹配 一 行 的 开始 

Ss 匹配 一 行 的 结束 


14.1.2 ”字符 转 义 


在 正则 表达 式 中 有 时 也 需要 字符 转 义 ， 图 14-1 中 的 w 字符 不 表示 英文 字母 w， 而 是 表示 
任何 语言 的 单词 字符 〈 如 英文 字母 、 亚 洲 文字 等 )、 数 字 和 下 画 线 等 内 容 时 ， 需 要 在 w 字母 前 
加 上 反 斜 本 “\”。 反 斜 枉 “\” 也 是 基本 元 字符 ， 与 Python 语言 中 的 字符 转 义 是 类 似 的 。 

不 仅 可 以 对 普通 字符 进行 转 义 ， 还 可 以 对 基本 元 字符 进行 转 义 。 如 图 14-1 所 示 ， 其 中 点 
“. ”字符 是 希望 按照 点 “.” 的 字面 意义 使 用 ， 作 为 .com 域名 的 一 部 分 ， 而 不 是 作为 “.” 基 
本 元 字符 使 用 ， 所 以 需要 加 反 斜 杠 “\ ”进行 转 义 ， 即 “\.” 才 是 表示 点 “.” 的 字面 意义 。 

14.1.3 ”开始 与 结束 字符 

本 节 通 过 一 个 示例 介绍 在 Python 中 如 何 使 用 正则 表达 式 。 

在 14.1.1 节 介 绍 基本 元 字符 时 介绍 了 ^ 和 $， 它 们 可 以 用 于 匹配 一 行 字 符 串 的 开始 和 结 
束 。 当 以 ^ 开 始 时 ， 要 求 一 行 字符 串 的 开始 位 置 匹 配 ， 当 以 $ 结束 时 ， 要 求 一 行 字符 串 的 结束 
位 置 匹 配 。 所 以 正则 表达 式 \w+@zhijieketang\.com 和 人 w+@zhijieketang\.comg 是 不 同 的 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl4/ch14.1.3.py 


import re O 
pl = r'Nw+ezhijieketangN.com' @ 
p2 = r'^\wt@zhijieketang\.coms$"' @ 
text = "Tony's email is tony guan588@zhijieketang.com." 
m= re.search(pl, text) @ 
print (m) # 匹配 


m= re.search (p2，text) © 
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Print (m) # 不 匹配 


email = "tony_guan588ezhijieketang.com' 
m = re.search(p2，email) 


print (m) # 匹配 


输出 结果 如 下 : 


<_sre.SRE Match object; span=(16, 45), match='tony guan588@zhijieketang.com'> 
None 


<_sre.SRE Match object; span=(0, 29), match='tony guan588@zhijieketang.com'> 


上 述 代 码 第 @ 行 是 导入 Python 正则 表达 式 模 块 re。 代 码 第 @@ 行 和 第 @ 行 定义 了 两 个 正则 
表达 式 。 

代码 第 图 行 通过 search() 函数 在 字符 串 text 中 查找 匹配 pl 正则 表达 式 ， 如 果 找 到 第 一 个 
则 返回 match 对 象 ， 如 果 没 有 找到 则 返回 None。 注 意 pl 正则 表达 式 开始 和 结束 没有 ^ 和 8$ 符 
号 ， 所 以 re.search(pl, text) 会 成 功 返回 match 对 象 ， 见 输出 结果 。 

代码 第 @ 行 通过 search() 函数 在 字符 串 text 中 查找 匹配 p2 正则 表达 式 ， 由 于 p2 正则 表达 
式 开 始 和 结束 有 ^ 和 8$ 符号 ， 匹 配 时 要 求 text 字符 串 开 始 和 结束 都 要 与 正则 表达 式 开 始 和 结束 
匹配 。 

代码 第 @ 行 中 re.search(p2, email) 的 email 字符 串 开 始 和 结束 都 能 与 正则 表达 式 开 始 和 结 
束 匹 配 ， 所 以 会 成 功 返回 match 对象。 


注意 : 在 正则 表达 式 中 本 身 包含 很 多 反 儿 本 “\” 等 特殊 字符 串 ， 推 荐 使 用 Python 中 原 
始 字符 串 表 示 正 则 表达 式 ， 否 则 需要 对 这 些 字符 进行 转 义 ， 所 以 pl 变量 也 可 以 使 用 \\w+@ 
zhijieketang\\.com' 普通 字符 串 形式 。 


14.2 ”字符 类 


正则 表达 式 中 可 以 使 用 字符 类 (Character class)， 一 个 字符 类 定义 一 组 字符 ， 其 中 的 任 一 
字符 出 现在 输入 字符 串 中 即 匹配 成 功 。 注 意 每 次 匹配 只 能 匹配 字符 类 中 的 一 个 字符 。 


14.2.1 定义 字符 类 


定义 一 个 普通 的 字符 类 需要 使 用 “[ ”和 “] ”元 字符 类 。 例 如 想 在 输入 字符 串 中 匹配 Java 
或 java， 可 以 使 用 正则 表达 式 [Jj]ava。 示 例 代码 如 下 : 

# coding=utf-8 

# 代码 文件 ，chapter1l4/ch14.1.3.py 


import re 


p= zi[djjava' 


m= re.search(p, 'I like Java and Python.') 
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print (m) # 匹配 
m = re.search(p, 'I like JAVA and Python.') (0) 
print (m) # 不 匹配 


m = re.search(p, 'I like java and Python.') 


Print (m) # 匹配 

输出 结果 如 下 : 

<_sre.SRE Match object; span=(7, 11), match='Java'> 
None 


<_sre.SRE Match object; span=(7, 11), match='java'> 


上 述 代码 第 @ 行 中 JAVA 字符 串 不 匹配 正则 表达 式 [j]ava， 其 他 的 两 个 都 是 匹配 的 。 


提示 : 如 果 想 JAVA 字符 串 也 能 匹配 ， 可 以 使 用 正则 表达 式 JavaljavalJAVA， 其 中 的 “|” 
是 基本 元 字符 ， 在 14.1.1 节 介 绍 过 它 ， 表 示 “ 或 关系 "， 即 Java、java 或 JAVA 都 可 以 匹配 。 


14.2.2 字符 类 取 反 
在 正则 表达 式 中 指定 不 想 出 现 的 字符 ， 可 以 在 字符 类 前 加 “^” 符 号 。 示 例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l4/ch14.2.2.py 


import re 
p= r'[^0123456789]"' [0) 


m= re.search(p, '1000') 
print (m) # 不 匹配 


m= re.search(p, "Python 3') 
print (m) # 匹配 


输出 结果 如 下 : 


None 
<_sre.SRE Match object; span=(0, 1), match="'P'> 


上 述 代 码 第 @@ 行 定义 正则 表达 式 [^0123456789]， 它 表示 输入 字符 串 中 出 现 非 0~9 数字 即 
匹配 ， 即 出 现在 [0123456789] 以 外 的 任意 一 字符 即 匹配 。 


14.2.3 区间 


14.2.2 节 示 例 中 的 [^0123456789] 正则 表达 式 ， 事 实 上 有 些 麻烦 ， 这 种 连续 的 数字 可 以 
使 用 区 间 表 示 。 区 间 是 用 连 字 符 “-” 表 示 的 ， 例 如 [0123456789] 采用 区 间 表 示 为 [0-9]， 
[^0123456789] 采用 区 间 表 示 为 [^0-9]。 区 间 还 可 以 表示 连续 的 英文 字母 字符 类 ， 例 如 [a-z] 表 
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示 所 有 小 写字 母 字符 类 ，[A-Z] 表示 所 有 大 写字 母 字符 类 。 

另外 ， 也 可 以 表示 多 个 不 同 区 间 ，[A-Za-z0-9] 表示 所 有 字母 和 数字 字符 类 ，[0-25-7] 表示 
0、1、2、5、6、7 几 个 字符 组 成 的 字符 类 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter1l4/ch14.2.3.py 


import re 


m= re.search(r' [A-2a-z0-9]', 'A10.3') 


print (m) # 匹配 

m= re.search(r'[0-25-7]', 'A3489C') 

print (m) # 不 匹配 

输出 结果 如 下 : 

<_sre.SRE Match object; span=(0, 1), match='A'> 
None 


14.2.4 ”预定 义 字符 类 
有 些 字符 类 很 常用 ， 例 如 [0-9] 等 。 为 了 书写 方便 ， 正 则 表达 式 提供 了 预定 义 的 字符 类 ， 
例如 预定 义 字符 类 \d 等 价 于 [0-9] 字符 类 。 预 定义 字符 类 如 表 14-2 所 示 。 


表 14-2 预定 义 字符 类 


EE 说 明 
8 匹配 任意 一 个 字符 
\ 匹配 反 斜 杠 \ 字 符 
un 匹配 换行 
Yr 匹配 回 车 
¥f 匹配 一 个 换 页 符 
Vt 匹配 一 个 水 平 制 表 符 
Ww 匹配 一 个 垂直 制 表 符 
\s 匹配 一 个 空格 符 ， 等 价 于 [mefvv] 
\S 匹配 一 个 非 空格 符 ， 等 价 于 [^\s] 
\d 匹配 一 个 数字 字符 ， 等 价 于 [0-9] 


Db 匹配 一 个 非 数字 字符 ， 等 价 于 [^0-9] 


匹配 任何 语言 的 单词 字符 ( 如 英文 字母 、 亚 洲 文字 等 ) 、 数 字 和 下 画 线 “ ”等 字符 ， 如 果 正 则 表达 
式 编译 标志 设置 为 ASCII， 则 只 匹配 [azA-Z0-9 ] 


Ww 等 价 于 [^\w] 
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示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l4/ch14.2.4.py 
import re 


#p = r'[^0123456789]" 
p= rr'\D' @O 


m= re.search(p, '1000') 
print (m) # 不 匹配 


m= re.search(p, 'Python 3') 
print (m) # 匹配 


text = ' 你 们 好 Hello' 


m= re.search(r'\w', text) © 
print (m) # 匹配 

输出 结果 如 下 : 

None 


<_sre.SRE Match object; span=(0, 1), match='P'> 
<_sre.SRE Match object; span=(0，1)，match=' 你 '> 


上 述 代 码 第 @ 行 使 用 正则 表达 式 \D 替代 [^0123456789]。 代 码 第 @ 行 通过 正则 表达 式 \w 


在 text 字符 串 中 查找 匹配 字符 ， 找 到 的 结果 是 ' 你 ' 字 符 ，\w 默认 是 匹配 任何 语言 的 字符 ， 所 
以 找到 ' 你 ' 字 符 。 


14.3 ”量词 


在 此 之 前 学 习 的 正则 表达 式 元 字符 只 能 匹配 显示 一 次 字符 或 字符 串 ， 如 果 想 匹配 显示 多 次 
字符 或 字符 串 可 以 使 用 量词 。 


14.3.1 量词 的 使 用 
量词 表示 字符 或 字符 串 重复 的 次 数 ， 正 则 表达 式 中 的 量词 如 表 14-3 所 示 。 


表 14-3 量词 
字 符 说 明 
? 出 现 零 次 或 一 次 
, 出 现 零 次 或 多 次 
网 出 现 一 次 或 多 次 
{n} 出 现 n 次 
{nm} 至 少 出 现 n 次 但 不 超过 m 次 
{n.} 至 少 出 现 n 次 


量词 的 使 用 示例 代码 如 下 : 


# coding=utf-8 


# 代码 文件 : chapter1l4/ch14.3.1.py 


import re 


m= re.search(r'\d?', '87654321') 
print (m) 
m= re.search(r'\d?', 'ABC') 
print (m) 
m= re.search(r'\d*', '87654321') 
print (m) 
m= re.search(r'\d*', 'ABC') 
print (m) 
m= re.search(r'\d+', '87654321') 
print (m) 
m= re.search(r'\d+', 'ABC') 
print (m) 
m= re.search(r'\d{8}', '87654321') 
print (m) 
m= re.search(r'\d{8}', 'ABC') 
print (m) 
m= re.search(r'\d{7,8}', '87654321') 
print (m) 
m= re.search(r'\d{9,}', '87654321') 
print (m) 
输出 结果 如 下 : 
<_sre.SRE Match object; span=(0, 1), 
<_sre.SRE Match object; span=(0, 0), 
<_sre.SRE Match object; span=(0, 8), 
<_sre.SRE Match object; span=(0, 0), 
<_sre.SRE Match object; span=(0, 8), 
None 
<_sre.SRE_Match object; span=(0, 8), 
None 
<_sre.SRE Match object; span=(0, 8), 
None 

= | 
14.3.2” 贪 禁 量词 和 懒惰 量词 


量词 还 可 以 细 分 为 贪 禁 量词 和 懒惰 量词 ， 
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# 出 现 数字 一 次 
# 匹配 字符 '8" 


# 出 现 数字 零 次 
# 匹配 字符 '' 


# 出 现 数字 多 次 
# 匹配 字符 '87654321' 


# 出 现 数字 零 次 
# 匹配 字符 '' 


# 出 现 数字 多 次 
# 匹配 字符 '87654321' 


# 不 匹配 

# 出 现 数字 8 次 

# 匹配 字符 '87654321' 
# 不 匹配 

# 出 现 数字 8 次 


# 匹配 字符 '87654321' 


# 不 匹配 


match="8'> 
match=''> 
87654321'> 
match=" "> 
match='87654321'> 


match= 


match="87654321 "> 


match="87654321 "> 


贪 禁 量词 会 尽 可 能 多 地 匹配 字符 ， 懒 惰 量 词 会 尽 
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可 能 少 地 匹配 字符 。 大 多 数 计算 机 语言 的 正则 表达 式 量词 默认 是 贪 禁 的 ， 要 想 使 用 懒惰 量词 在 
量词 后 面 加 “? ” 即 可 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter1l4/ch14.3.2.py 


import re 


# 使 用 贪 禁 量 词 

m= re.search(r'\d{5,8}', '87654321') 志 出 现 数字 8 次 @ 
Print (m) # 匹配 字符 '87654321' 

# 使 用 惰性 量词 

m= re.search(r'\d{5,8}?', '87654321') # 出 现 数字 5 次 @ 
print (m) # 匹配 字符 '87654' 

输出 结果 如 下 : 


<_sre.SRE Match object; span=(0, 8), match='87654321'> 

<_sre.SRE Match object; span=(0, 5), match="'87654'> 

上 述 代码 第 @ 行 使 用 了 贪 禁 量 词 {5,8}， 输 入 字符 串 '87654321' 是 长 度 8 位 的 数字 字符 
串 ， 尽 可 能 多 地 匹配 字符 结果 是 '87654321'。 代 码 第 @ 行 使 用 惰性 量词 {5,8}?， 输 入 字符 
串 '87654321' 是 长 度 8 位 的 数字 字符 串 ， 尽 可 能 少 地 匹配 字符 结果 是 '87654'。 


14.4 ”分 组 


l 在 此 之 前 学 习 的 量词 只 能 重复 显示 一 个 字符 ， 如 果 想 让 一 个 字符 串 作为 整体 使 用 量词 ， 可 
将 这 个 字符 串 放 到 一 对 小 括号 中 ， 这 就 是 分 组 〈 也 称 子 表达 式 )。 


14.4.1 分 组 的 使 用 


对 正则 表达 式 进行 分 组 不 仅 可 以 对 一 个 字符 串 整 体 使 用 量词 ， 还 可 以 在 正则 表达 式 中 引用 
已 经 存在 的 分 组 。 这 一 节 先 介 绍 如 何 使 用 分 组 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl4/ch14.4.1.py 


import re 


Pp = r'(121) {2}" O 
m= re.search(p, '121121abcabc') 

print (m) # 匹配 

print (m.group ()) # 返回 匹配 字符 串 @ 


print (m.group (1)) # 获得 第 一 组 内 容 @ 
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P=r'(\d{3,4})-(\d{7,8})" @ 
m= re.search(p, '010-87654321') 

print (m) # 匹配 

print (m.group()) # 返回 匹配 字符 串 
print (m.groups ()) # 获得 所 有 组 内 容 回 
输出 结果 如 下 : 


<_sre.SRE Match object; span=(0, 6), match="'121121'> 

121 

<_sre.SRE Match object; span=(0, 12), match='010-87654321'> 

('010', '87654321') 

上 述 代 码 第 @ 行 定义 的 正则 表达 式 (121) 是 将 121 字符 串 分 为 一 组 ，(121){2} 表示 对 121 
重复 两 次 ， 即 121121。 代 码 第 @ 行 调用 match 对 象 的 group0 方法 返回 匹配 的 字符 串 ，groupO 
方法 语法 如 下 : 


match.group([groupl, ...]) 


其 中 参数 group1l 是 组 编号 ， 在 正则 表达 式 中 组 编号 是 从 1 开始 的 ， 所 以 代码 第 @ 行 的 表达 式 
m.group(1) 表示 返回 第 一 个 组 内 容 。 

代码 第 @ 行 定义 的 正则 表达 式 可 以 用 来 验证 固定 电话 号 码 ， 在 “-” 之 前 是 3~4 位 的 区 号 ， 
“-” 之 后 是 7~8 位 的 电话 号 码 。 在 该 正则 表达 式 中 有 两 个 分 组 .代码 第 @ 行 是 match 对 象 的 
groups() 方法 返回 所 有 分 组 ， 返 回 值 是 一 个 元 组 。 


14.4.2 ”分 组 命名 


在 Python 程序 中 访问 分 组 时 ， 除 了 可 以 通过 组 编号 进行 访问 ， 还 可 以 通过 组 名 进行 访问 ， 
前 提 是 要 在 正则 表达 式 中 为 组 命名 。 组 命名 通过 在 组 开头 添加 “?P< 分 组 名 > ”实现 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ;chapter1l4/ch14.4.2.py 


import re 


p = r'(?P<area code>\d{3,4})-(?P<phone code>\d{7,8})" [0 
m= re.search( p, '010-87654321') 

print (m) # 匹配 

print (m.group ()) # 返回 匹配 字符 串 
print (m.groups ()) # 获得 所 有 组 内 容 


# 通过 组 编号 返回 组 内 容 
print (m.group (1)) 
Print (m.group (2)) 


# 通过 组 名 返回 组 内 容 


print (m.group ('area_code')) 


@e 


print (m.group ('phone_ code')) 
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输出 结果 如 下 : 


<_sre.SRE Match object; span=(0, 12), match="010-87654321'> 
010-87654321 

('010', '87654321') 

010 

87654321 

010 

87654321 


上 述 代码 第 @ 行 定义 了 正则 表达 式 ， 这 个 正则 表达 式 与 14.4.1 节 是 一 样 的 ， 可 以 用 来 验证 
电话 号 码 ， 只 是 对 其 中 的 两 个 组 进行 了 命名 。 当 在 程序 中 访问 这 些 带 有 名 字 的 组 时 ， 可 以 通过 
组 编号 或 组 名 字 访 问 ， 代 码 第 @ 行 和 第 @ 行 通过 组 名 字 访 问 组 内 容 。 

14.4.3 反 向 引用 分 组 


除了 可 以 在 程序 代码 中 访问 正则 表达 式 匹配 之 后 的 分 组 内 容 ， 还 可 以 在 正则 表达 式 内 部 引 
用 之 前 的 分 组 。 

下 面 通过 示例 熟悉 一 下 反 向 引用 分 组 。 假 设 由 于 工作 需要 想 解析 一 段 XML 代码 ， 需 要 找 
到 某 一 个 开始 标签 和 结束 标签 ， 那 么 编写 如 下 代码 : 


# coding=utf-8 

# 代码 文件 : chapterl4/ch14.4.3.py 
import re 

p= I'<([\Ww]+t)>.*</([\w]+)>" 


m= re.search(p, '<a>abc</a>') 


print (m) # 匹配 

m= re.search(p, '<a>abc</b>') 四 
Print (m) # 匹配 

输出 结果 如 下 : 


<_sre.SRE Match object; span=(0, 10), match='<a>abc</a>'> 
<_sre.SRE Match object; span=(0, 10), match='<a>abc</b>'> 


上 述 代码 第 Q@ 行 定义 的 正则 表达 式 分 成 了 两 组 ， 两 组 内 容 完全 一 样 。 代 码 第 @ 行 和 第 @ 行 
在 进行 测试 ， 结 果 发 现 它们 都 是 匹配 的 。<a>abc</b> 不 是 有 效 的 XML 代码 ， 因 为 开始 标签 和 
结束 标签 应 该 是 一 致 的 。 可 见 代 码 第 中 行 的 正则 表达 式 不 能 保证 开始 标签 和 结束 标签 是 一 致 
的 ， 它 不 能 保证 两 个 组 保持 一 致 。 为 了 解决 此 问题 ， 可 以 使 用 反 向 引用 ， 即 让 第 二 组 反 向 引用 
第 一 组 。 在 正则 表达 式 中 反 向 引用 语法 是 “\ 组 编号 "， 组 编号 是 从 1 开始 的 。 

重 构 上 面 的 示例 : 


# coding=utf-8 
# 代码 文件 : chapterl2/ch14.4.3.py 
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import re 
p= r'<([\w]+)>.*</\1>" # 使 用 反 向 引用 @ 


m= re.search(p, '<a>abc</a>') 
print (m) # 匹配 


m = re.search(p, '<a>abc</b>') 


print (m) # 不 匹配 

输出 结果 如 下 : 

<_sre.SRE Match object; span=(0, 10), match='<a>abc</a>'> 
None 


上 述 代码 第 @ 行 是 定义 正则 表达 式 ， 其 中 \1 是 反 向 引用 第 一 个 组 。 从 运行 结果 可 见 字 符 
串 <a>abc</a> 是 匹配 的 ， 而 <a>abc</b> 字符 串 不 匹配 。 


14.4.4 “ 非 捕获 分 组 


前 面 介绍 的 分 组 称 为 捕获 分 组 。 捕 获 分 组 的 匹配 子 表达 式 结果 被 暂时 保存 到 内 存 中 ， 以 备 
表达 式 或 其 他 程序 引用 ， 这 个 过 程 称 为 “捕获 ”， 捕 获 结果 可 以 通过 组 编号 或 组 名 进行 引用 。 
但 是 有 时 并 不 想 引用 子 表达 式 的 匹配 结果 ， 不 想 捕获 匹配 结果 ， 只 是 将 小 括号 作为 一 个 整体 进 
行 匹 配 ， 此 时 可 以 使 用 非 捕获 分 组 ， 在 组 开头 使 用 “?: ”可 以 实现 非 捕获 分 组 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 chapterl4/ch14.4.4.py 


import re 
3 = 'imgl.jpg,img2.jpg,img3.bmp' 


# 捕获 分 组 

P = r'\wt(\.jpg)" © 
mlist = re.findall (p, 3s) 

print (mlist) 


# 非 捕获 分 组 

P = Fr'Nw+(?:\.jpg)， ©@ 
mlist = re.findall (p, 3s) 

print (mlist) 


输出 结果 : 


['.jpg', '.jpg'"] 
['imgl.jpg', 'img2.jpg'] 


上 述 代码 实现 了 从 字符 串 中 查找 .jpg 结尾 的 文本 ， 其 中 代码 第 @ 行 和 第 @ 行 的 正则 表达 式 
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区 别 在 于 前 者 是 捕获 分 组 ， 后 者 是 非 捕获 分 组 。 捕 获 分 组 将 括号 中 的 内 容 作为 子 表达 式 进 行 捕 
获 匹 配 ， 将 匹配 的 子 表达 式 〈 即 组 的 内 容 ) 返回 ， 结 果 是 [jpg','jpg]。 而 非 捕获 分 组 将 括号 
中 的 内 容 作 为 普通 的 正则 表达 式 字符 串 进行 整体 匹配 ， 即 找到 .jpg 结尾 的 文本 ， 所 以 最 后 结果 
是 [imgl.jpg', 'img2.jpg]。 


14.5 re 模块 


re 是 Python 内 置 的 正则 表达 式 模块 ， 前 面 虽然 已 经 使 用 过 re 模块 一 些 函 数 ， 但 还 有 很 多 
要 函数 没有 详细 介绍 ， 这 一 节 将 详细 介绍 这 些 函 数 。 


回 
志 巴 看 视频 。 14.S.1 searchO 和 match0 函数 


search() 和 match() 函数 非常 相似 ， 它 们 的 区 别 如 下 所 示 。 

。search(): 在 输入 字符 串 中 查找 ， 返 回 第 一 个 匹配 内 容 ， 如 果 找 到 一 个 则 match 对 象 ， 如 
果 没 有 找到 返回 None。 

。match0 : 在 输入 字符 串 开 始 处 查找 匹配 内 容 ， 如 果 找 到 一 个 则 match 对 象 ， 如 果 没 有 找 
到 返回 None。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl4/ch14.5.1.py 


import re 

Pp = r'\wt@zhijieketang\.com' 

text = "Tony's email is tony guan588@zhijieketang.com." (0) 
m= re.search(p, text) 


print (m) # 匹配 


m= re.match(p, text) 


print (m) # 不 匹配 

email = 'tony_ guan588@zhijieketang.com' @ 
m = re.search(p, email) 

print (m) # 匹配 

m= re.match(p, email) 

print (m) # 匹配 


# match 对 象 几 个 方法 

Print ('match 对 象 几 个 方法 :') @ 
print (m.group ()) 

print (m.start ()) 

print (m.end()) 

print (m.span()) 
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输出 结果 如 下 : 


<_sre.SRE Match object; span=(16, 45), match='tony guan588@zhijieketang.com'> 
None 

<_sre.SRE Match object; span=(0, 29), match='tony guan588@zhijieketang.com'> 
<_sre.SRE Match object; span=(0, 29), match='tony guan588@zhijieketang.com'> 
match 对 象 几 个 方法 : 

tony_guan588@zhijieketang.com 

0 

29 

(0，29) 


上 述 代 码 第 @ 行 输入 字符 串 开 头 不 是 email，search0 函数 可 以 匹配 成 功 ， 而 match0 函数 却 
匹配 失败 。 代 码 第 @ 行 输入 字符 串 开头 就 是 email， 所 以 searchO0 和 match0) 函数 都 可 匹配 成 功 。 

search() 和 match() 函数 如 果 匹 配 成 功 都 返回 match 对 象 。match 对 象 有 一 些 常用 方法 ， 见 代 
码 第 @ 行 。 其 中 group0 方法 返回 匹配 的 子 字符 串 ，start0 方法 返回 子 字符 串 的 开始 索引 ，end0 
方法 返回 子 字符 串 的 结束 索引 ; span0 方法 返回 子 字符 串 的 跨度 ， 它 是 一 个 二 元 素 的 元 组 。 


14.5.2 findall0 和 finditer0 困 数 


findall( 和 finditer() 函数 非常 相似 ， 它 们 的 区 别 如 下 所 示 。 

。findall() : 在 输入 字符 串 中 查找 所 有 匹配 内 容 ， 如 果 匹 配 成 功 ， 则 返回 match 列表 对 象 ， 
如 果 匹 配 失 败 则 返回 None。 

。finditer() : 在 输入 字符 串 中 查找 所 有 匹配 内 容 ， 如 果 匹 配 成 功 ， 则 返回 容纳 match 的 可 
迭代 对 象 ， 通 过 夫 代 对 象 每 次 可 以 返回 一 个 match 对 象 ， 如 果 匹 配 失败 则 返回 None。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter1l4/ch14.5.2.py 


import re 


p= rr"'[Jj]java' 
text = 'I like Java and java.' 


match list = re.findall (p, text) [0 
print (match list) 


match iter = re.finditer(p, text) 


©@© 


for m in match iter: 


Print (m.group () ) 


输出 结果 如 下 : 


['Java', 'java'] 
Java 


java 


上 述 代 码 第 @ 行 的 findall0 函数 返回 match 列表 对 象 。 代 码 第 @ 行 的 finditer() 函数 返回 
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可 和 迭代 对 象 。 代 码 第 @@ 行 通过 for 循环 遍历 可 迭代 对 象 。 
14.5.3 ”字符 串 分 割 


字符 串 分 割 使 用 splitO) 函数 ， 该 函数 按照 匹配 的 子 字符 串 进行 字符 串 分 割 ， 返 回 字 符 串 列 
表 对 象 。 


re.split (pattern, string, maxsplit=0, flags=0) 


其 中 参数 pattern 是 正则 表达 式 ， 参数 string 是 要 分 割 的 字符 串 ; 参数 maxsplit 是 最 大 分 
割 次 数 ，maxsplit 默认 值 为 零 ， 表 示 分 割 次 数 没有 限制 ;参数 flags 是 编译 标志 ， 有 关 编 译 标 
志 会 在 14.6 节 介绍 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l4/ch14.5.3.py 


import re 


p= rr"'\d+t' 
text = 'AB12CD34EF' 


clist = re.split(p, text) [0 
print (clist) 


clist = re.split(p, text, maxsplit=1) @ 
print (clist) 


clist = re.split(p, text, maxsplit=2) 四 
print (clist) 


输出 结果 如 下 : 

['AB', 'CD', 'EF'] 

['AB', 'CD34EF'] 

['AB', 'CD', 'EF'] 

上 述 代 码 调 用 split0 函数 通过 数字 对 'AB12CD34EF' 字符 串 进行 分 割 ，\d+ 正则 表达 式 匹 
配 一 到 多 个 数字 。 代 码 第 四 行 splitO 函数 中 参数 maxsplit 和 flags 是 默认 的 ， 分 割 的 次 数 没有 
限制 ， 分 割 结果 是 ['AB', 'CD', 'EF'] 列表 。 

代码 第 @ 行 splitO 函数 指定 maxsplit 为 1， 分 割 结果 是 [AB', 'CD34EF'] 列表 ， 列 表 元 素 
的 个 数 是 maxsplit+ 1 。 

代码 第 图 行 split0 函数 指定 maxsplit 为 2，2 是 最 大 可 能 的 分 割 次 数 ， 因 此 maxsplit>=2 
与 maxsplit=0 是 一 样 的 。 


14.5.4 字符 串 替 换 
字符 串 车 换 使 用 sub0 函数 ， 该 函数 用 于 替换 匹配 的 子 字符 串 ， 返 回 值 是 蔡 换 之 后 的 字符 串 。 


re.sub(pattern, repl, string, count=0, flags=0) 
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其 中 参数 pattern 是 正则 表达 式 ， 参数 repl 是 替换 字符 串 ， 参数 string 是 要 提供 的 字符 串 ; 
参数 count 是 要 蔡 换 的 最 大 数量 ， 默 认 值 为 零 ， 表 示 替 换 数量 没有 限制 ， 参 数 flags 是 编译 标 
志 ， 有 关 编 译 标志 会 在 14.6 节 介 绍 。 

示例 代码 如 下 : 

# coding=utf-8 

# 代码 文件 : chapter1l4/ch14.5.4.py 


import re 


B= Nd 
text = "AB12CD34EF' 


repace text = re.sub(p, ' ', text) O 


print (repace text) 


repace text = re.sub(p, ' ', text, count=1) @ 


print (repace_ text) 


repace text = re.sub(p, ' ', text, count=2) @ 


print (repace text) 


输出 结果 如 下 : 


AB CD EF 
AB CD34EF 
AB CD EF 


上 述 代 码 调用 sub() 函数 蔡 换 'AB12CD34EF' 字符 串 中 的 数字 。 代 码 第 @ 行 sub0) 函数 中 
参数 count 和 flags 都 是 默认 的 ， 蔡 换 的 最 大 数量 没有 限制 ， 蔡 换 结果 是 AB CD EF。 

代码 第 @ 行 sub() 函数 指定 count 为 1， 蔡 换 结果 是 AB CD34EF。 

代码 第 @ 行 sub0 函数 指定 count 为 2，2 是 最 大 可 能 的 替换 次 数 ， 因 此 count>=2 与 
count=0 是 一 样 的 。 


14.6 ”编译 正则 表达 式 


到 此 为 止 ， 所 介绍 的 Python 正则 表达 式 内 容 足 可 以 开发 实际 项 目 了 。 但 是 为 了 提高 效率 ， 国 扩 
还 可 以 对 Python 正则 表达 式 进行 编译 。 编 译 的 正则 表达 式 可 以 重复 使 用 ， 这 样 能 减少 正则 表 澡 
达 式 的 解析 和 验证 ， 提 高 效率 。 ee 
在 re 模块 中 的 compile() 函数 可 以 编译 正则 表达 式 ，compile() 函数 语法 如 下 : 


re.compile (pattern[, flags=0]) 


其 中 参数 pattern 是 正则 表达 式 ， 参 数 flags 是 编译 标志 。compile() 函数 返回 一 个 编译 的 正 
则 表达 式 对 象 regex。 
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14.6.1 已 编译 正则 表达 式 对 象 


compile() 函数 返回 一 个 编译 的 正则 表达 式 对 象 ， 该 对 象 也 提供 了 文本 的 匹配 、 查 找 和 蔡 
换 等 操作 的 方法 ， 这 些 方法 与 14.5 节 介绍 的 re 模块 函数 功能 类 似 。 表 14-4 所 示 是 已 编译 正则 
表达 式 对 象 方法 与 re 模块 函数 对 照 表 。 


表 14-4 已 编译 正则 表达 式 对 象 方法 与 re 模块 函数 对 照 
常用 函数 已 编译 正则 表达 式 对 象 方法 re 模块 函数 
search() regex.search(string[, pos[, endpos]]) re.search(pattern, string, flags=0) 
match() regex.match(string[, pos[, endpos]]) re.match(pattern, string, flags=0) 
findall0 regex,findall(string[, pos[. endpos]]) refindall(pattern, string, flags=0) 


finditerO) regex finditer(string[, pos[. endpos]]) re .finditer(pattern, string, flags=0) 


sub() regex.sub(repl, string, count=0) re.sub(pattern, repl, string, count=0, flags=0) 


splitO regex.split(string, maxsplit=0) re.split(pattern, string, maxsplit=0, flags=0) 


正则 表达 式 方法 需要 一 个 已 编译 的 正则 表达 式 对 象 才能 调用 ， 这 些 方法 与 re 模块 函数 功 
能 类 似 ， 这 里 不 再 一 一 资 述 。 注 意 方法 search()、match()、findall( 和 finditer() 中 的 参数 pos 
为 开始 查找 的 索引 ， 参 数 endpos 为 结束 查找 的 索引 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter14/ch14.6.1.py 


import Fe 


Pp = r'\wt@zhijieketang\.com' 
regex = re.compile(p) @ 


text = "Tony's email is tony guan588@zhijieketang.com." 
m= regex.search (text) 
print (m) # 匹配 


m= regex.match (text) 


print (m) # 不 匹配 


p = r'flojlava' 
regex = re.compile(p) © 


text = 'I like Java and java.' 


match list = regex.findall (text) 
print (match 1ist) # 匹配 


match iter = regex.finditer (text) 
for m in match iter: 


print (m.group () ) 


Nd 
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regex = re.compile(p) 加 
text = 'AB12CD34EF"' 


clist = regex.split(text) 
print (clist) 


repace text = regex.sub(' ', text) 


print (repace_text) 


输出 结果 如 下 : 
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<_sre.SRE Match object; span=(16, 45), match='tony guan588@zhijieketang.com'> 


None 

['Java', 'java'] 
Java 

java 

['AB', 'CD', 'EF'] 
AB CD EF 


上 述 代码 第 @ 行 、 第 @ 行 和 第 @ 行 都 是 编译 正则 表达 式 ， 然 后 通过 已 编译 的 正则 表达 式 对 
象 regex 调用 方法 实现 文本 匹配 、 查 找 和 替换 等 操作 。 这 些 方 法 与 re 模块 函数 类 似 ， 这 里 不 再 


奖 述 。 
14.6.2 ”编译 标志 


compile() 函数 编译 正则 表达 式 对 象 时 ， 还 可 以 设置 编译 标志 。 编 译 标志 可 以 改变 正则 表 


达 式 引擎 行为 。 本 节 详 细 介绍 几 个 常用 的 编译 标志 。 
1) ASCII 和 Unicode 


在 表 14.2 中 介绍 过 预定 义 字 符 类 \w 和 \W， 其 中 \w 匹配 单词 字符 ， 在 Python 2 中 是 
ASCII 编码 ， 在 Python 3 中 则 是 Unicode 编码 ， 所 以 包含 任何 语言 的 单词 字符 。 可 以 通过 编译 
标志 Ie.ASCII (或 re.A) 设置 采用 ASCII 编码 ， 通 过 编译 标志 re.UNICODE (或 re.U) 设置 采 


用 Unicode 编码 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl4/ch14.6.2-1.py 


import re 
text = ' 你们 好 Hello' 


p= r'\wt' 
regex = re.compile(p, re.U) OO 


m = regex.search (text) 
Print (m) # 匹配 


m = regex.match (text) 四 
Print (m) # 匹配 


186 二 Python 从 小 白 到 大 牛 


regex = re.compile(p, re 


m = regex.search (text) 


print (m) 


m = regex.match (text) 
print (m) 


输出 结果 如 下 : 


.A) 


# 匹配 


# 不 匹配 


<_sre.SRE Match object; span=(0，8)，match=' 你 们 好 Hello'> 


<_sre.SRE Match object; span=(0, 
<_sre.SRE Match object; span=(3, 8), match='Hello'> 


None 


8) ，match=' 你 们 好 Hello'> 


上 述 代码 第 @ 行 设置 编译 标志 为 Unicode 编码 ， 代 码 第 @ 行 用 search() 方法 匹配 “你 们 好 
Hello ”字符 串 ， 代 码 第 @ 行 的 match() 方法 也 可 匹配 “你 们 好 Hello ”字符 串 。 

代码 第 @ 行 设置 编译 标志 为 ASCII 编码 ， 代 码 第 @ 行 用 search() 方法 匹配 “ Hello ”字符 
串 ， 而 代码 第 @@ 行 的 match() 方法 不 可 匹配 。 


2) 忽略 大 小 写 


默认 情况 下 正则 表达 式 引擎 对 大 小 写 是 敏感 的 ， 但 有 时 在 匹配 过 程 中 需要 忽略 大 小 写 ， 可 
以 通过 编译 标志 re.IGNORECASE (或 re.D 实现 。 


示例 代码 如 下 : 
# coding=utf-8 
# 代码 文件 : chapterl4/ch14 


import re 


p= r'(java).*(python)' 
regex = re.compile(p, re 


m= regex.search('I like 
print (m) 


m= regex.search('I like 
print (m) 


m= regex.search('I like 


print (m) 


输出 结果 如 下 : 


<_sre.SRE Match object; 
<_sre.SRE Match object; 
<_sre.SRE Match object; 


上 述 代 码 第 @ 行 定义 了 正则 表达 式 。 


0220Dy 


a 


Java and Python.') 
# 匹配 


JAVA and Python.') 
# 匹配 


java and Python.') 
# 匹配 


span=(7, 22), match= 
span=(7, 22), match= 


span=(7, 22), match= 


@e 


'Java and Python'> 
'JAVA and Python'> 
"java and Python'> 


代码 第 @ 行 是 编译 正则 表达 式 ， 设 置 编译 参数 re 工 忽 


略 大 小 写 。 由 于 忽略 了 大 小 写 ， 代 码 中 三 个 search( 方法 都 能 找到 匹配 的 字符 串 。 
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3) 点 元 字符 匹配 换行 符 

默认 情况 下 正则 表达 式 引擎 中 点 “ .” 元 字符 可 以 匹配 除 换行 符 外 的 任何 字符 ， 但 是 有 时 
需要 点 “. ”元 字符 也 能 匹配 换行 符 ， 这 可 以 通过 编译 标志 re.DOTALL (或 re.S) 实现 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter14/ch14.6.2-3.py 


import re 


P = 工 '.+" 
regex = re.compile(p) 


m= regex.search('Hello\nWorld.') 
print (m) # 匹配 


regex = re.compile(p, re.DOTALL) 


m= regex.search('Hello\nWorld.') 
print (m) # 匹配 


输出 结果 如 下 : 


<_sre.SRE Match object; span=(0, 5), match='Hello'> 
<_sre.SRE Match object; span=(0, 12), match='Hello\nWorld.'> 


上 述 代码 第 @ 行 编译 正则 表达 式 时 没有 设置 编译 标志 。 代 码 第 @@ 行 匹配 结果 是 'Hello' 字 
符 串 ， 因 为 正则 表达 式 引擎 遇 到 换行 符 “ \n ”时 ， 认 为 它 是 不 匹配 的 ， 就 停止 查找 。 而 代码 第 
@ 行 编译 了 正则 表达 式 ， 并 设置 编译 标志 re.DOTALL。 代 码 第 @ 行 匹配 结果 是 'HellomWorld.' 
字符 串 ， 因 为 正则 表达 式 引擎 遇 到 换行 符 “\ ”时 认为 它 是 匹配 的 ， 会 继续 查找 。 

4) 多 行 模式 

编译 标志 re.MULTILINE (或 re.M) 可 以 设置 为 多 行 模式 ， 多 行 模式 对 于 元 字符 ^ 和 8$ 行 
为 会 产生 影响 。 默 认 情 况 下 ^ 和 $ 匹配 字符 串 的 开始 和 结束 ， 而 在 多 行 模式 下 ^ 和 $ 匹配 任意 
一 行 的 开始 和 结束 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl4/ch14.6.2-4.py 


import re 


p = r'^World’ 


©o 


regex = re.compile (p) 


m = regex.search('Hello\nWorld.') 


print (m) # 不 匹配 


regex = re.compile(p, re.M) @ 
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m = regex.search('Hello\nWorld.') © 
print (m) # 匹配 


输出 结果 如 下 : 


None 


<_sre.SRE Match object; span=(6, 11), match='World'> 


上 述 代码 第 @ 行 定义 了 正则 表达 式 ^World， 即 匹配 World 开头 的 字符 串 。 代 码 第 @ 行 
进行 编译 时 并 没有 设置 多 行 模 式 ， 所 以 代码 第 @ 行 'HellomWorld.' 字符 串 是 不 匹配 的 ， 虽 
然 'HellomWorld.' 字符 串 事实 上 是 两 行 ， 但 默认 情况 ^World 只 匹配 字符 串 的 开始 。 

代码 第 @ 行 重新 编译 了 正则 表达 式 ， 此 时 设置 了 编译 标志 re.M， 开 启 多 行 模式 。 在 多 行 
模式 下 ^ 和 8$ 匹配 字符 串 任意 一 行 的 开始 和 结束 ， 所 以 代码 第 @ 行 会 匹配 World 字符 串 。 

5) 详细 模式 

编译 标志 re.VERBOSE (或 re.X) 可 以 设置 详细 模式 ， 详 细 模式 下 可 以 在 正则 表达 式 中 添 
加 注释 ， 可 以 有 空格 和 换行 ， 这 样 编写 的 正则 表达 式 非常 便于 阅读 。 

示例 代码 如 下 : 


import re 


p= """(java) # 匹配 java 字符 串 
# 匹配 任意 字符 零 或 多 个 
(python) # 匹配 python 字符 串 
， 四 
regex = re.Ccompile(Pp，re.I | re.VERBOSE) @ 


m= regex.search('I like Java and Python. 
print (m) # 匹配 


m= regex.search('I like JAVA and Python. 
print (m) # 匹配 


m= regex.search('I like java and Python.') 
print (m) # 匹配 


上 述 代码 第 @ 行 定义 的 正则 表达 式 原本 是 (java).*(python)， 现 在 写成 多 行 表示 ， 其 中 还 有 注 
释 和 空格 等 内 容 。 如 果 没 有 设置 详细 模式 ， 这 样 的 正则 表达 式 会 抛 出 异常 。 由 于 正则 表达 式 中 
包含 了 换行 等 符号 ， 所 以 需要 使 用 双重 单 引号 或 三 重 双 引号 括 起 来 ， 而 不 是 使 用 原始 字符 串 。 

代码 第 @ 行 编译 正则 表达 式 时 ， 设 置 了 两 个 编译 标志 re.I 和 re.VERBOSE， 当 需要 设置 多 
编译 标志 时 ， 编 译 标志 之 间 需 要 位 或 运算 符 “|”。 


本 章 小 结 


通过 对 本 章 的 学 习 ， 读 者 可 以 熟悉 Python 中 的 正则 表达 式 ， 正 则 表达 式 中 理解 各 种 元 
字符 是 学 习 的 难点 和 重点 。 本 章 后 续 介绍 Python 正则 表达 式 re 模块 ， 读 者 需要 重点 掌握 
search()、match()、findall()、finditer()、sub() 和 split( 函数 。 最 后 介绍 了 编译 正则 表达 式 ， 读 
者 需要 了 解 编译 对 象 的 方法 和 编译 标志 。 
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程 


15:1 


文件 操作 主要 包括 对 文件 内 容 的 读 写 操作 ， 这 些 操 作 是 通过 文件 对 象 〈file objecb 实现 


文件 操作 与 管理 


序 经 常 需要 访问 文件 和 目录 ， 读 取 文 件 信息 或 写 入 信息 到 文件 ， 在 Python 语言 中 对 文 
件 的 读 写 是 通过 文件 对 象 (file objecb 实现 的 。Python 的 文件 对 象 也 称 为 类 似 文件 对 象 〈file- 
like objecb 或 流 〈stream)， 文 件 对 象 可 以 是 实际 的 磁盘 文件 ， 也 可 以 是 其 他 存储 或 通信 设备 ， 
如 内 存 缓冲 区 、 网 络 、 键 盘 和 控制 台 等 。 那 么 为 什么 称 为 类 似 文件 对 象 呢 ? 是 因为 Python 提 
供 一 种 类 似 于 文件 操作 的 API (如 read() or write() 方法 ) 实现 对 底层 资源 的 访问 。 

本 章 先 介绍 通过 文件 对 象 操作 文件 ， 然 后 再 介绍 文件 与 目录 的 管理 。 


文件 操作 


的 ， 通 过 文件 对 象 可 以 读 写 文本 文件 和 二 进 制 文件 。 
15.1.1 打开 文件 


文件 对 象 可 以 通过 open( 函数 获得 。open0 函数 是 Python 内 置 函数 ， 它 屏蔽 了 创建 文件 
对 象 的 细节 ， 使 得 创建 文件 对 象 变 得 简单 。open() 函数 语法 如 下 : 


oP 
True, 


en (file, mode='r', buffering=-1， encoding=None, 


opener=None) 


errors=None, newline=None, closefd= 


open() 函数 共有 8 个 参数 ， 其 中 参数 file 和 mode 是 最 为 常用 的 ， 其 他 的 参数 一 般 情况 下 


很 少 使 
1) 
fil 

可 以 是 

符 指 向 
2) 


file 参数 
e 参数 是 要 打开 的 文件 ， 可 以 是 字符 


一 个 已 经 打开 的 文件 。 
mode 参数 


mode 参数 用 来 设置 文件 打开 模式 。 文 件 
如 表 15-1 所 示 。 
15-1 中 b 和 t 是 文件 类 型 模式 ， 如 果 是 二 进 制 文件 需要 设置 站 、wb、xb、ab， 如 果 是 
件 需 要 设置 rt+、wt、xt、at， 由 于 t 是 默认 模式 ， 所 以 可 以 省 略为 r、w、x、a。 


表 
文本 文 


， 下 面 分 别 说 明 一 下 这 些 参数 的 含义 。 


打开 模式 


或 整数 。 如 果 file 是 字符 串 表 示 文 件 名 ， 文 件 名 
相对 当前 目录 的 路 径 ， 也 可 以 是 绝对 路 径 ; 如 果 file 是 整数 表示 文件 描述 符 ， 文 件 描述 


字符 串 表 示 ， 最 基本 的 文件 打开 模式 
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表 15-1 文件 打开 模式 


字 符 串 说 明 
r 只 读 模式 打开 文件 (默认 ) 
w 写 和 模式 打开 文件 ,会 覆盖 已 经 存在 的 文件 
x 独占 创建 模式 ,文件 不 存在 时 创建 并 以 写 和 模式 打开 ， 如果 文件 已 存在 则 抛 出 异常 FileExistsError 
a 追加 模式 ， 如 果 文 件 存在 则 写 人 内容 追加 到 文件 末尾 
b 二 进 制 模式 
t 文本 模式 (默认 ) 
+ 更 新 模式 


+ 必须 与 [、w、x 或 a 组 合 使 用 来 设置 文件 为 读 写 模式 ， 对 于 文本 文件 可 以 使 用 r+、w+、 
x+ 或 a+， 对 于 二 进 制 文件 可 以 使 用 rb+、wb+、xb+ 或 ab+。 


注意 : r+、w+ 和 a+ 区 别 如 下 : r+ 打开 文件 时 如 果 文 件 不 存在 则 抛 出 异常 ; w+ 打开 文件 
时 如 果 文 件 不 存在 则 创建 文件 ， 文 件 存在 则 清除 文件 内 容 ; at+ 类 似 于 w+， 打 开 文件 时 如 果 文 
件 不 存在 则 创建 文件 ， 文件 存 在 则 在 文件 末尾 追加 。 


3) buffering 参数 

buffering 是 设置 缓冲 区 策略 ， 默 认 值 为 -1， 当 buffering=-1 时 系统 会 自动 设置 缓冲 区 ， 
通常 是 4096 或 8192 字 节 ; 当 buffering=0 时 关闭 缓冲 区 ， 关 闭 缓冲 区 时 数据 直接 写 入 文件 中 ， 
这 种 模式 主要 应 用 于 二 进 制 文件 的 写 入 操作 ; 当 buffering>0 时 ，buffering 用 来 设置 缓冲 区 字 
节 大 小 。 


提示 : 使 用 缓冲 区 是 为 提高 效率 减少 IO 操作 ,文件 数据 首先 放 到 缓冲 区 中 ， 当 文件 关闭 
或 刷新 缓冲 区 时 ， 数据 才 真正 写 入 文件 中 ， 


4) encoding 和 errors 参数 

encoding 用 来 指定 打开 文件 时 的 文件 编码 ， 主 要 用 于 文本 文件 的 打开 。errors 参数 用 来 指 
定编 码 发 生 错 误 时 如 何 处 理 。 

5) newline 参数 

Newline 用 来 设置 换行 模式 。 

6) closefd 和 opener 参数 

这 两 个 参数 在 file 参数 为 文件 描述 符 时 使 用 。closefd 为 True 时 ,文件 对 象 调 用 close() 
方法 关闭 文件 ， 同 时 也 会 关闭 文件 描述 符 所 对 应 的 文件 ;closefd 为 False 时 ， 文 件 对 象 调用 
close() 方法 关闭 文件 ， 但 不 会 关闭 文件 描述 符 所 对 应 的 文件 。opener 参数 用 于 打开 文件 时 执行 
的 一 些 加 工 操作 ，opener 参数 执行 一 个 函数 ， 该 函数 返回 一 个 文件 描述 符 。 


提示 : 文件 描述 符 是 一 个 整数 值 ， 它 对 应 到 当前 程序 已 经 打开 的 一 个 文件 。 例 如 标准 输入 
文件 描述 符 是 0， 标准 输出 文件 描述 符 是 1， 标 准 错误 文件 描述 符 是 2， 打 开 其 他 文件 的 文件 
描述 符 依次 是 3、4、5 等 数字 。 


示例 代码 如 下 : 
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# coding=utf-8 
# 代码 文件 :chapterl5/ch15.1.1.py 


f = open('test.txt', 'w+') © 
f.write('World') 


上 = open('test.txt', ‘r+') 回 
f.write('Hello') 


Ef "obenl"tests txt"y "ay @ 
Ewritet™ "DY 

fname = r'C:\Users\win-mini\PycharmProjects\HelloProj\test.txt"' @ 
f = open(fname, 'a+') © 
f.write('World') 


运行 上 述 代 码 会 创建 一 个 test.txt 文件 ， 文 件 内 容 是 Hello World。 代 码 第 @ 行 通过 w+ 模 
式 打 开 文件 test.txt， 由 于 文件 test.txt 不 存在 所 以 会 创建 test.txt 文件 。 代 码 第 @ 行 通过 r+ 模 
式 打 开 文 件 test.txt， 由 于 在 此 前 已 经 创建 了 test.txt 文 件 ，r+ 模式 会 覆盖 文件 内 容 。 代 码 第 
@@ 行 通过 a 模式 打开 文件 test.txt， 会 在 文件 末尾 追加 内 容 。 代 码 第 @ 行 通过 a+ 模式 打开 文件 
test.txt， 也 会 在 文件 末尾 追加 内 容 。 代 码 第 @ 行 是 绝对 路 径 文 件 名 ， 由 于 字符 串 中 有 反 斜 杠 ， 要 
么 采用 转 义 字符 “\\” 表 示 ， 要 么 采用 原始 字符 串 表示 ， 本 例 中 采用 原始 字符 串 表示 ， 另 外 文件 路 
径 中 反 斜 本 “\” 也 可 以 改 为 斜 本 “1/” 在 UNIX 和 Linux 系统 中 都 是 采用 斜 杠 分 隔 文件 路 径 的 。 


1S.1.2 ”关闭 文件 


当 使 用 open0 函数 打开 文件 后 ， 若 不 再 使 用 文件 应 该 调用 文件 对 象 的 close() 方法 关闭 文 
件 。 文 件 的 操作 往往 会 抛 出 异常 ， 为 了 保证 文件 操作 无 论 正常 结束 还 是 异常 结束 都 能 够 关闭 文 
件 ， 调 用 close() 方法 应 该 放 在 异常 处 理 的 finally 代码 块 中 。 但 笔者 更 推荐 使 用 with as 代码 块 
进行 自动 资源 管理 ， 具 体内 容 参 考 12.6 节 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapterl5/ch15.1.2.py 


# 使 用 finally 关闭 文件 
f name = "test.txt'" 
try: 


@ 日 


£f = open(f_name) 
except OSError as e: 
print (' 打开 文件 失败 ') 
else: 
print (' 打开 文件 成 功 ') 
try: 四 
content = f.read() 
print (content) 
except OSError as e: 


print (' 处 理 OSError 异常 ') 
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finally: 
f-close() @ 


# 使 用 with as 自动 资源 管理 
with open(f name, 'r') as f: © 
content = f.read() 


print (content) 


上 述 示 例 通过 两 种 方式 关闭 文件 。 代 码 第 @ 行 ~ 第 @ 行 是 在 finally 中 关闭 文件 ， 该 示例 
类 似 于 12.6.2 节 介 绍 的 示例 。 这 里 示例 有 点 特殊 ， 使 用 了 两 个 try 语句 ，finally 没有 与 代码 第 
@ 行 的 try 匹配 ， 而 是 嵌 套 到 else 代码 块 中 与 代码 第 @ 行 的 try 匹配 。 这 是 因为 代码 第 四 行 的 
open(f name) 如 果 打 开 文 件 失 败 则 f 为 None， 此 时 调用 close() 方法 会 引发 异常 。 

代码 第 加 行使 用 了 with as 打开 文件 ，open( 返回 文件 对 象 赋值 给 f 变 量 。 在 with 代码 块 
中 fread() 是 读 取 文件 内 容 ， 见 代码 第 @ 行 。 最 后 在 with 代码 结束 ， 关 闭 文件 。 


15.1.3 ”文本 文件 读 写 


文本 文件 读 写 的 单位 是 字符 ， 而 且 字 符 是 有 编码 的 。 文 本 文件 读 写 主要 方法 有 如 下 几 种 。 

，read(size=-1): 从 文件 中 读 取 字符 串 ，size 限制 最 多 读 取 的 字符 数 ，size=-1 时 没有 限制 ， 
读 取 全 部 内 容 。 

，readline(size=-1) : 读 取 到 换行 符 或 文件 尾 并 返回 单行 字符 串 ， 如 果 已 经 到 文件 尾 ， 则 
返回 一 个 空 字 符 串 ，size 是 限制 读 取 的 字符 数 ，size=-1 时 没有 限制 。 

*， readlines(hint=-1) : 读 取 文 件数 据 到 一 个 字符 串 列表 中 ， 每 一 个 行 数 据 是 列表 的 一 个 元 
素 ，hint 是 限制 读 取 的 行 数 ，hint=-1 时 没有 限制 。 

。 write(s) : 将 字符 串 s 写 入 文件 ， 并 返回 写 入 的 字符 数 。 

*， writelines(lines) : 向 文件 中 写 入 一 个 列表 ， 不 添加 行 分 隔 符 ， 因 此 通常 为 每 一 行 末尾 提 
供 行 分 隔 符 。 

，flush0: 刷新 写 缓冲 区 ， 数 据 会 写 入 到 文件 中 。 

下 面 通过 文件 复制 示例 熟悉 一 下 文本 文件 的 读 写 操作 ， 代 码 如 下 : 

# coding=utf-8 

# 代码 文件 : chapterl5/ch15.1.3.py 


f name = 'test.txt" 


with open(f name, 'r', encoding='utf-8') as f: @ 
lines = f.readlines() © 
print (lines) 
copy_f name = 'copy.txt" 
with open(copy f name, 'w', encoding="'utf-8') as copy_f: [@) 
copy_f.writelines (lines) @ 


print (' 文件 复制 成 功 ') 


上 述 代 码 实现 了 将 test.txt 文件 内 容 复制 到 copy.txt 文件 中 。 代 码 第 Q@ 行 是 打开 test.txt 文 
件 ， 由 于 test.txt 文 件 采用 UTF-8 编码 ， 因 此 打开 时 需要 指定 UTF-8 编码 。 代 码 第 @ 行 通过 
readlines( 方法 读 取 所 有 数据 到 一 个 列 中 ， 这 里 选择 哪 一 个 读 取 方 法 要 与 代码 第 @ 行 的 写 入 方 
法 对 应 ， 本 例 中 是 writelines() 方法 。 代 码 第 @ 行 打开 要 复制 的 文件 ， 采 用 的 打开 模式 是 w， 
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如 果 文件 不 存在 则 创建 ， 如 果 文 件 存在 则 覆盖 ， 另 外 注意 编码 集 也 要 与 test.txt 文件 保持 一 致 。 
15.1.4 二进制 文件 读 写 


二 进 制 文件 读 写 的 单位 是 字 节 ， 不 需要 考虑 编码 的 问题 。 二 进 制 文件 读 写 主要 方法 如 下 。 

。read(size=-1): 从 文件 中 读 取 字 节 ，size 限制 最 多 读 取 的 字 节 数 ， 如 果 size=-1 则 读 取 全 
部 字 节 。 

。readline(size=-1) : 从 文件 中 读 取 并 返回 一 行 , size 限制 读 取 的 行 数 , size=-1 时 没有 限制 。 

"readlines(hint=-1) : 读 取 文件 数据 到 一 个 列表 中 ， 每 一 个 行 数据 是 列表 的 一 个 元 素 ， 

hint 是 限制 读 取 的 行 数 ，hint=-1 时 没有 限制 。 

write(b) : 写 入 b 字 节 ， 并 返回 写 入 的 字 节 数 。 

writelines(lines) : 向 文件 中 写 入 一 个 列表 ， 不 添加 行 分 隔 符 ， 因 此 通常 为 每 一 行 末 尾 提 

供 行 分 隔 符 。 

flush(): 刷新 写 缓冲 区 ， 数 据 会 写 入 到 文件 中 。 

下 面 通过 文件 复制 示例 熟悉 一 下 文本 文件 的 读 写 操作 ， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapter1l5/ch15.1.4.py 


f name = "coco2dxcplus.jpg'" 


with open(f name, 'rb') as f: 
b = f.read() 
copy_f_name = "copy.jpg'" 
with open(copy_f name, 'wb') as copy_f: 


@@ eo 


copy_f.write(b) 
print (' 文件 复制 成 功 ') 


上 述 代码 实现 了 将 coco2dxcplus.jpg 文件 内 容 复 制 到 当前 目录 的 copy.jpg 文件 中 。 代 码 第 
@ 行 打开 coco2dxcplus.jpg 文件 , 打开 模式 是 tb。 代码 第 @ 行 通过 read() 方法 读 取 所 有 数据 ， 
返回 字 节 对 象 b。 代 码 第 @ 行 打开 要 复制 的 文件 ， 打 开 模 式 是 wb， 如 果 文 件 不 存在 则 创建 ， 
如 果 文 件 存在 则 覆盖 。 代 码 第 @ 行 采用 write() 方法 将 字 节 对 象 b 写 入 文件 中 。 


15.2 os 模块 


Python 对 文件 的 操作 是 通过 文件 对 象 实现 的 ， 文 件 对 象 属于 Python 的 io 模块 。 如 果 通 过 
Python 程序 管理 文件 或 目录 ， 如 删除 文件 、 修 改 文件 名 、 创 建 目录 、 删 除 目 录 和 遍历 目录 等 ， 
可 以 通过 Python 的 os 模块 实现 。 

os 模块 提供 了 使 用 操作 系统 功能 的 一 些 函数 ， 如 文件 与 目录 的 管理 。 本 节 介绍 一 些 os 模 
块 中 与 文件 和 目录 管理 相关 的 函数 ， 这 些 函数 如 下 。 

。os.rename(src, dst) : 修改 文件 名 ，src 是 源 文 件 ，dst 是 目标 文件 ， 它 们 都 可 以 是 相对 当 

前 路 径 或 绝对 路 径 表 示 的 文件 。 

。os.remove(path) : 删除 path 所 指 的 文件 ， 如 果 path 是 目录 ， 则 会 引发 OSError。 

。os.mkdir(path) : 创建 path 所 指 的 目录 ， 如 果 目 录 已 存在 ， 则 会 引发 FileExistsError。 

。os.rmdir(path) : 删除 path 所 指 的 目录 ， 如 果 目 录 非 空 ， 则 会 引发 OSError。 
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。os.walk(top) : 遍历 top 所 指 的 目录 树 ， 自 项 向 下 遍历 目录 树 ， 返 回 值 是 一 个 三 元 组 ( 目 
录 路 径 , 目录 名 列表 , 文件 名 列表 ) 。 

"os.listdir(din) : 列 出 指定 目录 中 的 文件 和 子 目录 。 

常用 的 属性 有 以 下 两 种 。 

。os.curdir 属性 : 获得 当前 目录 。 

。os.pardir 属性 : 获得 当前 父 目 录 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l5/ch15.2.py 


import os 


f name = 'test.txt" 
copy_f name = 'copy.txt" 


with open(f name, 'r') as f: 
b= f.read() 
with open(copy_f name, 'w') as Copy _f: 
copy_f.write(b) 


try: 

os.rename (copy_f_name, 'copy2.txt') 
except OSError: 

os.remove('copy2.txt') 


print(os.listdir(os.curdir)) 


©S©@ © © 


print(os.listdir(os.pardir)) 


try: 


@ 


os.mkdir('subdir') 
except OSError: 


@ 


os.rmdir('subdir') 


for item in os.walk('.'): 
print (item) 


上 述 代 码 第 Q@ 行 是 修改 文件 名 。 代 码 第 @ 行 是 在 修改 文件 名 失败 情况 下 删除 copy2.txt 文 
件 。 代 码 第 @ 行 os.curdir 属性 是 获得 当前 目录 ，os.listdir0 函数 是 列 出 指定 目录 中 的 文件 和 子 
目录 。 代 码 第 @ 行 os.pardir 属性 是 获得 当前 父 目录 。 代 码 第 @ 行 os.mkdir(subdir) 是 在 当前 
目录 下 创建 子 目录 subdir。 代 码 第 @ 行 是 在 创建 目录 失败 时 删除 subdir 子 目录 。 代 码 第 @ 行 
os.walk('.) 返回 当前 目录 树 下 所 有 目录 和 文件 ， 然 后 通过 for 循环 进行 遍历 。 


15.3 os.path 模块 


对 于 文件 和 目录 的 操作 往往 需要 路 径 ，Python 提供 的 os.path 模块 提供 对 路 径 、 目 录 和 文 
件 等 进行 管理 的 函数 。 本 节 介 绍 一 些 os.path 模块 的 常用 函数 ， 这 些 函 数 如 下 。 


回 
扫 码 看 视频 
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。os.path.abspath(path): 返回 path 的 绝对 路 径 。 

。os.path.basename(path): 返回 path 路 径 的 基础 名 部 分 ， 如 果 path 指向 的 是 一 个 文件 ， 则 
返回 文件 名 ; 如 果 path 指向 的 是 一 个 目录 ， 则 返回 最 后 目录 名 。 

。，os.path.dirname(path): 返回 path 路 径 中 目录 部 分 。 

。os.path.exists(path): 判断 path 文件 是 否 存在 。 

os.path.isfile(path): 如 果 path 是 文件 ， 则 返回 True。 

。os.path.isdir(path):; 如 果 path 是 目录 ， 则 返回 True。 

。os.path.getatime(path) : 返回 最 后 一 次 的 访问 时 间 ， 返 回 值 是 一 个 UNIX 时 间 戳 〈1970 

年 1 月 1 日 00:00:00 以 来 至 现在 的 总 秒 数 )， 如 果 文 件 不 存在 或 无 法 访问 ， 则 引发 

OSError。 

os.path.getmtime(path) : 返回 最 后 修改 时 间 ， 返 回 值 是 一 个 UNIX 时 间 戳 ， 如 果 文 件 不 

存在 或 无 法 访问 ， 则 引发 OSError。 

os.path.getctime(path): 返回 创建 时 间 ， 返 回 值 是 一 个 UNIX 时 间 惟 ， 如 果 文 件 不 存在 或 

无 法 访问 ， 则 引发 OSError。 

0s.path.getsize(path) : 返回 文件 大 小 ， 以 字 节 为 单位 ， 如 果 文 件 不 存在 或 无 法 访问 ， 则 

引发 OSError。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter15/ch15.3.py 


import os.path 
from datetime import datetime 


f name = "test.txt'" 
af name = r'C:/Users/win-mini/PycharmProjects/HelloProj/test.txt' 


# 返回 路 径 中 基础 名 部 分 
basename = os.path.basename (af name) 
print (basename) # test.txt 


# 返回 路 径 中 目录 部 分 
dirname = os.path.dirname (af_name) 
print (dirname) 


# 返回 文件 的 绝对 路 径 
print (os.path.abspath(f_name) ) 


# 返回 文件 大 小 

print (os.path.getsize(f name)) # 25 

# 返回 最 近 访 问 时 间 

atime = datetime.fromtimestamp (0s.path.getatime (f_name)) 
print (atime) 

# 返回 创建 时 间 

ctime = datetime.fromtimestamp (os.path.getctime (f_name)) 
print (ctime) 


# 返回 修改 时 间 
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mtime = datetime.fromtimestamp(os.path.getmtime(f_name)) 


print (mtime) 


print (os.path.isfile(dirname)) # False 
print (os.path.isdir (dirname)) # True 
print (os.path.isfile(f name)) # True 

print (os.path.isdir(f name)) # False 
print (os.path.exists(f name)) # True 


输出 结果 如 下 : 


test.txt 
C:/Users/win-mini/PycharmProjects/HelloProj 
C:\Users\win-mini\PycharmProjects\HelloProj\test.txt 
25 

2018-02-14 01:21:19.356459 

2018-02-13 15:45:48.130517 

2018-02-14 01:23:04.020678 

False 

True 

True 

False 

True 


本 章 小 结 


本 章 主要 介绍 了 Python 文件 操作 和 管理 技术 ， 在 文件 操作 部 分 介绍 了 文件 的 打开 和 关闭 ， 
以 及 如 何 读 写 文本 文件 和 二 进 制 文件 。 最 后 还 详细 介绍 了 os 和 os.path 模块 。 


第 三 篇 
Python 高 级 实用 库 与 框架 


本 篇 包括 5 章 内 容 ， 介 绍 了 Python 实际 开发 中 高 级 实用 库 与 框架 。 内 容 包 括 数 
据 交 换 格 式 ， 数 据 库 编程 ， 网 络 编程 ，wxPython 图 形 用 户 界 面 编程 和 Python 多 线程 
编程 。 通 过 本 篇 的 学 习 ， 读 者 可 以 全 面 了 和解 Python 编程 中 的 一 些 实用 库 与 框架 ， 熟 
悉 这 些 库 与 框架 的 使 用 


@ 第 16 章 数据 交换 格式 

@ 第 17 章 数据 库 编 程 

@ 第 18 章 网 络 编程 

@ 第 19 章 wxPython 图 形 用 户 界面 编程 
@ 第 20 章 Python 多 线程 编程 


呈 


数据 交换 就 像 两 个 人 在 聊天 一 样 ， 采 用 彼此 都 能 “ 听 ” 得 懂 的 语言 ， 你 来 我 往 ， 其 中 的 语 
言 就 相当 于 通信 中 的 数据 交换 格式 。 有 时 候 ， 为 了 防止 聊天 被 人 偷 听 ， 可 以 采用 暗语 。 同 理 ， 
计算 机 程序 之 间 也 可 以 通过 数据 加 密 技 术 防 止 “ 偷 听 ”。 

数据 交换 格式 有 CSV 格式 、XML 格式 和 JSON 格式 。 

例如 ， 为 了 告诉 别人 一 些 事情 ， 会 写 下 如 图 16-1 所 示 的 留言 条 。 留 言 条 有 一 定 的 格式 ， 
如 图 16-1 所 示 ， 共 有 4 部 分 一 一 称谓 、 内 容 、 落 款 和 时 间 。 


称 请 


云龙 同学 ， 内 究 | 
你 好 1 \ 
全 天 革 秆 ， 我 到 你 家 未 想 向 你 借 一 本 《路 学 本 带 用 成 庄 

词典 )》。 可 是 未 巧 ， 你 在 。 我 准备 晚上 6 时 再 来 借 书 ， 请 你 ) 

在 家 里 等 我 ， 谢 谢 ! pa 


Ee wy 
| 美 东 外 > 
时 间 一 ~、 


“3 2012 年 12 月 8 卓 


一 
图 16-1 留言 条 格式 


如 果 使 用 CSV 格式 描述 留言 条 ， 可 以 采用 如 下 形式 : 


" 云龙 同学 "，" 你 好 ! \n 今天 上 午 , 我 到 你 家 来 想 向 你 借 一 本 《小 学 生 常 用 成 语词 典 》。 可 是 不 巧 ， 你 不 在 。 
我 准备 晚上 6 时 再 来 借 书 。 请 你 在 家 里 等 我 ， 谢 谢 ! "," 关东 升 ", "2012 年 12 月 08 日 " 


留言 条 中 的 4 部 分 数据 按照 顺序 存放 ， 各 个 数据 项 之 间 用 逗号 分 隔 。 数 据 量 小 的 时 候 可 以 
采用 这 种 格式 ， 但 是 随 着 数据 量 的 增加 ， 问 题 也 会 暴露 出 来 ， 开 发 人 员 可 能 会 搞 乱 它们 的 顺 
序 ， 如 果 各 个 数据 部 分 能 有 描述 信息 就 好 了 。 而 XML 和 JSON 格式 可 以 自 带 描述 信息 ， 称 为 
“ 自 描述 的 ”结构 化 文档 。 

将 上 面 的 留言 条 写成 XML 格式 ， 具 体 如 下 : 


<?xml version="1.0" encoding="UTF-8"?> 


<note> 
<to> 云龙 同学 </to> 
<content> 你 好 ! \n 今天 上 午 ， 我 到 你 家 来 想 向 你 借 一 本 《小学生 常用 成 语词 典 》。 
可 是 不 巧 ， 你 不 在 。 我 准备 晚上 6 时 再 来 借 书 。 请 你 在 家 里 等 我 ， 谢 谢 ! </content> 
<from> 关东 升 </from> 
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<date>2012 年 12 月 08 日 </date> 
</note> 


位 于 尖 括 号 中 的 内 容 (<to>.…</to> 等 ) 就 是 描述 数据 的 标识 ， 在 XML 中 称 为 “标签 ”。 
将 上 面 的 留言 条 写成 JSON 格式 ， 具 体 如 下 : 
{to:" 云龙 同学 ", content:" 你 好 ! \n 今天 上 午 ， 我 到 你 家 来 想 向 你 借 一 本 《小 学 生 常 用 成 语词 典 》。 可 


是 不 巧 ， 你 不 在 。 我 准备 晚上 6 时 再 来 借 书 。 请 你 在 家 里 等 我 ， 谢 谢 ! ",from:" 关东 升 ", date:"2012 年 12 月 
08 日 "} 


数据 放置 在 大 括号 “ {} ”中 ， 每 个 数据 项 之 前 都 有 一 个 描述 名 〈 如 to 等 )， 描 述 名 和 数据 
项 之 间 用 冒号 “: ”分开 。 

通过 对 比 可 发 现 ，JSON 所 用 的 字 节 数 一 般 要 比 XML 少 ， 这 也 是 很 多 人 喜欢 采用 JSON 
格式 的 主要 原因 ， 因 此 JSON 也 称 为 “ 轻 量 级 ”的 数据 交换 格式 。 接 下 来 将 详细 介绍 这 三 种 数 
据 交换 格式 。 


16.1 CSV 数据 交换 格式 


CSV (Comma Separated Values) 是 用 逗号 分 隔 数据 项 (也 称 为 字段 ) 的 数据 交换 格式 ， 国 成 
CSV 主要 应 用 于 电子 表格 和 数据 库 之 间 的 数据 交换 。 1 

下 面 是 一 个 保存 图 书馆 图 书信 息 的 CSV 文档 。 

1， 软件 工程 ， 戴 国 强 ， 机 械 工业 出 版 社 ,19980528,，2 

2 汇编 语言 ， 李 利 光 ， 北 京 大 学 出 版 社 ,19980318,2 

3, 计算 机 基础 ， 王 飞 ， 经 济 科学 出 版 社 ，19980218,1 

4, FLASH 精 选 ， 刘 扬 ， 中 国 纺织 出 版 社 ,19990312,2 

5,java 基础 ， 王 一 ， 电 子 工业 出 版 社 ,19990528,3 

6， 世界 杯 ， 柳 飞 ， 世 界 出 版 社 ,19990412,2 

7, JAVA 程序 设计 ， 张 余 ， 人 民 邮 电 出 版 社 ,19990613,1 

8， 新 概念 3, 余 智 ， 外 语 出 版 社 ， 19990723, 2 


其 中 每 一 行 都 是 一 本 图 书信 息 ， 从 左 到 右 字段 是 图 书 编号 、 图 书 名 称 、 作 者 、 出 版 社 、 出 
版 时 间 和 库存 数量 。CSV 第 一 行 也 可 以 带 有 数据 项 名 ， 但 是 这 种 情况 并 不 利于 数据 交换 ， 
为 数据 交换 双方 要 约定 好 第 一 行 是 字段 名 还 是 数据 行 。 


提示 : 如 果 计 算 机 安装 了 Excel 电子 表格 软件 ， 则 可 以 使 用 Excel 打开 CSV 文件 ， 也 可 以 
将 Excel 中 的 表格 另存 为 CSV 文件 ， 但 这 个 过 程 可 能 会 导致 数据 格式 的 丢失 。 例 如 CSV 中 的 
"0001" 数据 使 用 Excel 打开 会 变 为 1。 另 外， 在 Windows 平台 下 默认 字符 集 是 GBK， 如 果 要 
想 用 Excel 打开 CSV 文件 且 不 乱码 ，CSV 文件 要 保存 为 GBK 字符 集 。 


读 写 CSV 数据 可 以 不 用 什么 特殊 库 模 块 ， 使 用 open() 函数 和 字符 串 的 split() 方法 就 可 以 
读 取 并 解析 CSV 数据 了 。 格 式 复杂 的 CSV 数据 使 用 split() 方法 分 隔 之 后 ， 还 需要 很 多 处 理工 
作 。 因 此 ， 笔 者 还 是 推荐 使 用 CSV 专用 模块 读 写 CSV 数据 ，Python 提供 了 csv 模块 用 来 处 理 
CSV 数据 ， 下 面 将 详细 介绍 。 


16.1.1 reader( 因数 
csv 模块 提供 了 两 个 对 CVS 数据 进行 读 写 的 基本 函数 csv.reader() 和 csv.writer()， 本 节 先 
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介绍 csv.reader() 函数 。csv.reader() 函数 定义 如 下 : 


csv.reader (csvfile, dialect='excel', **fmtparams) 


csv.reader() 函数 返回 一 个 读 取 器 reader 对 象 。csvfile 参数 是 CSV 文件 对 象 ;，dialect 参数 
是 方言 ， 方 言 提供 了 一 组 预定 好 的 格式 化 参数 ，fmtparams 参数 可 以 提供 单个 格式 化 参数 。 

方言 dialect 实际 参数 是 csv.Dialect 的 子 类 ，csv.Dialect 的 子 类 主要 有 以 下 3 种 。 

(1) csv.excel 类 定义 Excel 生成 的 CSV 文件 的 常用 属性 ， 它 的 方言 名 称 是 'excel'。 

(2) csv.excel_tab 类 定义 了 Excel 生成 的 Tab (水 平 制 表 符 ) 分 隔 文 件 的 常用 属性 ， 它 的 方 
言 名 称 是 'excel-tab'。 

(3) csv.unix_dialect 类 定义 在 UNIX 系统 上 生成 的 CSV 文件 的 常用 属性 ， 即 使 用 "\m' 作为 
行 终止 符 ， 而 Windows 下 使 用 \r' 作为 行 终止 符 ， 它 的 方言 名 称 是 "unix'。 

下 面 通过 一 个 示例 熟悉 一 下 csv.reader() 的 使 用 ， 示 例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l6/ch16.1.1.py 


import csv 


with open('data/books.csv', 'r', encoding='gbk') as rf: 
reader = csv.reader (rf, dialect=csv.excel) 
for row in reader: 
print('|'.join(row)) 


©S@eo 


上 述 代 码 第 @@ 行 通过 open() 函数 打开 CSV 文件 ， 指 定编 码 集 为 GBK， 这 是 因为 books. 
csv 文件 编写 时 采用 的 是 GBK 编码 集 。 代 码 第 @ 行 通过 csv.reader() 方法 返回 读 取 器 reader 对 
象 ， 方 言 参 数 传 入 的 是 csvexcel， 这 也 是 该 参数 的 默认 值 。 读 取 器 对 象 是 一 个 可 和 迭 代 对 象 ， 所 
以 可 以 使 用 for 循环 遍历 ， 见 代码 第 @@ 行 。 每 次 迭代 返回 的 是 一 条 记录 ， 返 回 数据 的 类 型 是 列 
表 ， 代 码 第 @ 行 用 小 join(row) 表达 式 将 列表 元 素 连接 起 来 ， 之 间 使 用 字符 “|” 进 行 分 隔 。 


16.1.2 ”writer0 函数 
csv.writer() 函数 的 定义 如 下 : 


csv.writer (csvfile, dialect='excel', **fmtparams) 


csv.writer() 函数 返回 一 个 写 入 器 writer 对 象 ， 函 数 参数 同 csv.reader() 函数 。 
下 面 通过 一 个 示例 熟悉 csv.writer() 函数 的 使 用 ， 该 示例 实现 了 从 一 个 以 逗号 分 隔 的 CSV 
文件 复制 到 另 一 个 以 水 平 制 表 符 分 隔 的 CSV 文件 ， 示 例 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter16/ch16.1.2.py 


import csv 


with open('data/books.csv', 'r', encoding='gbk') as rf: 
reader = csv.reader (rf) 
with open('data/books2.csv', 'w', newline='', encoding='gbk') as wf: [oy 
writer = csv.writer (wf, delimiter='\t') @ 


for row in reader: 
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print ("1'.join(row)) 


writer.writerow (row) @ 


上 述 代 码 中 books.csv 文件 是 逗号 分 隔 的 CSV 文件 , books2.csv 文件 是 水 平 制 表 符 分 隔 的 
CSV 文件 。 代 码 第 @ 行 是 通过 open0 函数 以 写 入 方式 打开 books2.csv 文件 ， 其 中 newline 参 
数 要 设置 为 空 字符 ， 就 是 在 写 入 一 行 数据 时 不 再 加 换行 符 ， 因 为 默认 情况 下 writer 对 象 写 入 数 
据 是 会 加 换行 符 的 。 代 码 第 @@ 行 是 通过 csv.writer( 方法 返回 写 入 器 writer 对 象 ，delimiter=\t' 
参数 设置 字段 之 间 采 用 水 平 制 表 符 分 隔 。 代 码 第 @@ 行 是 通过 写 入 器 writer 对 象 的 writerow(0) 方 
法 逐 行 写 入 数据 ， 参 数 row 是 字段 的 列表 。 


16.2 XML 数据 交换 格式 


XML 是 一 种 自 描述 的 数据 交换 格式 。 虽 然 XML 数据 交换 格式 不 如 JSON“ 轻 便 ”， 但 也 非常 重 加 
要 ， 多 年 来 一 直 被 用 于 各 种 计算 机 语言 中 ， 是 老牌 的 、 经 典 的 、 灵 活 的 数据 交换 方式 。 


16.2.1 XML 文档 结构 


在 读 写 XML 文档 之 前 ， 我 们 需要 了 解 XML 文档 结构 。 前 面 提 到 的 留言 条 XML 文档 由 
开始 标签 <note> 和 结束 标签 </note> 组 成 ， 它 们 就 像 括 号 一 样 把 数据 项 括 起 来 。 这 样 不 难看 
出 ， 标 签 <to></to> 之 间 是 “称谓 ”， 标 签 <content></content> 之 间 是 “内 容 ”， 标 签 <from> 
</from> 之 间 是 “落款 ”， 标 签 <date></date> 之 间 是 “日 期 ”。 

XML 文档 结构 要 遵守 一 定 的 格式 规范 。XML 虽然 在 形式 上 与 HTML 很 相似 ， 但 是 有 着 
严格 的 语法 规则 。 只 有 严格 按照 规范 编写 的 XML 文档 才 是 有 效 的 文档 ， 也 称 为 “格式 良好 ” 
的 XML 文档 。XML 文档 的 基本 架构 可 以 分 为 下 面 几 部 分 。 

1) 声明 

在 图 16-2 中 ，<?xml version="1.0" encoding="UTF-8"?> 就 是 XML 文件 的 声明 ， 它 定义 
了 XML 文件 的 版 本 和 使 用 的 字符 集 ， 这 里 为 1.0 版 ， 使 用 中 文 UTF-8 字符 。 

2) 根 元 素 

在 图 16-2 中 ，note 是 XML 文件 的 根 元 素 ，<note> 是 根 元 素 的 开始 标签 ，</note> 是 根 元 
素 的 结束 标签 。 根 元 素 只 有 一 个 ， 开 始 标签 和 结束 标签 必须 一 致 。 

3) 子 元 素 

在 图 16-2 中 ,to、content、from 和 date 是 根 元 素 note 的 子 元 素 。 所 有 元 素 都 要 有 结束 标签 ， 
开始 标签 和 结束 标签 必须 一 致 。 如 果 开 始 标签 和 结束 标签 之 间 没 有 内 容 ， 可 以 写成 <from/>， 
称 为 “ 空 标签 ”。 

4) 属性 

如 图 16-3 所 示 是 具有 属性 的 XML 文档 ， 而 留言 条 的 XML 文档 中 没有 属性 。 属 性 定义 在 
开始 标签 中 。 在 开始 标签 <Note id="1"> 中 ，id="1" 是 Note 元 素 的 一 个 属性 ，id 是 属性 名 ，1 是 
属性 值 ， 其 中 属性 值 必须 放置 在 双 引 号 或 单 引号 之 间 。 一 个 元 素 不 能 有 多 个 相同 名 字 的 属性 。 

5) 命名 空间 

命名 空间 用 于 为 XML 文档 提供 名 字 唯 一 的 元 素 和 属性 。 例 如 ， 在 一 个 学 籍 信息 的 XML 
文档 中 需要 引用 到 教师 和 学 生 ， 他 们 都 有 一 个 子 元 素 id， 这 时 直接 引用 id 元 素 会 造成 名 称 冲 
突 ， 但 是 将 两 个 id 元 素 放 到 不 同 的 命名 空间 中 就 会 解决 这 个 问题 。 图 16-4 中 以 xmlns: 开头 的 
内 容 都 属于 命名 空间 。 
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6) 限定 名 

它 是 由 命名 空间 引出 的 概念 ， 定 义 了 元 素 和 属性 的 合法 标识 符 。 限 定名 通常 在 XML 文档 
中 用 作 特 定 元 素 或 属性 引用 。 图 16-4 中 的 标签 <soap:Body> 就 是 合法 的 限定 名 ， 前 级 soap 是 
由 命名 空间 定义 的 。 


<note> “一 一 大 
<t05 云 龙 同学 </to> > 。 , 素 
<content> 你 好 1 \n 今 天 上 午 ， 我 到 你 家 来 想 向 你 借 一 本 《小 学 生 常 用 成 语词 典 》。 
可 是 不 巧 ， 你 不 在 。 我 准备 晚上 6 时 再 来 借 书 。 请 你 在 家 里 等 我 ， 谢 谢 ! </content> 
<from> 关 东升 </from> 
<date>2612 年 12 月 98 日 </datey> 

</note> 上 


图 16-2 XML 文档 结构 


<?xml version= 
<Notes> 
<Note id="1"3 6 一 局 性 
<CDate>2012-12-21</CDate> 
<Content> 早 上 8 点 钟 到 公司 </Content> 
<UserID>tony</UserID> 
</Note> 
<Note id="2"> 
<CDatey2912-12-22</CDatey> 
<Content> 发 布 105Book1</Content> 
<UserID>tony</UserID> 
</Note> 
</Notes> 


"encoding="UTF-8"?> 


图 16-3 有 属性 的 XML 文档 


<?xml version="1.0" encoding="utf-8"?> 
<soap: Envelope xmlns:xsi="Http://www.w3. org/2901/XHLSchena-instance 
xmlns:xsd="http://www.w3.0rg/2801/XMLSchema" 
xmlns:soap=f http://schemas.xnmlsoap.org/soap/envelope/"> 
<soap:Body> 
<queryResponse -xmlns="http: //tenpuri'ore/">” 一 
<queryResult> 站 
<Note> 
限定 名 <UserIDystringc/UserIDy> ) 
<CDate>string</CDate> 命名 空间 
<Content>string</Content> 
<ID>int</ID> 
</Note> 
<Note> 
<UserID>string¢/UserID> 
<CDate>string</CDate> 
<Content>string</Content> 
<ID>int<¢/ID> 
</Note> 
</queryResult> 
</queryResponse> 
</soap:Body> 
</soap:Envelope> 


图 16-4 命名 空间 和 限定 名 的 XML 文档 
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16.2.2 解析 XML 文档 


XML 文档 操作 有 “ 读 ”与 “ 写 ”两 种 ， 读 入 XML 文档 并 分 析 的 过 程 称 为 “解析 ”。 事 实 上 ， 
在 使 用 XML 进行 开发 的 过 程 中 ,“ 解 析 ”XML 文档 占 很 大 的 比重 。 

解析 XML 文档 在 目前 有 SAX 和 DOM 两 种 流行 的 模式 。 

。SAX (Simple API for XML) 是 一 种 基于 事件 驱动 的 解析 模式 。 解 析 XML 文档 时 ， 程 

序 从 上 到 下 读 取 XML 文档 ， 遇 到 开始 标签 、 结 束 标签 和 属性 等 ， 就 会 触发 相应 的 事 
件 。 但 是 这 种 解析 XML 文件 的 方式 有 一 个 次 端 ， 那 就 是 只 能 读 取 XML 文档 ， 不 能 写 
入 XML 文档 ， 它 的 优点 是 解析 速度 快 。 所 以 如 果 只 是 对 读 取 进 行 解析 ， 推 荐 使 用 SAX 
模式 解析 。 

。，DOM (Document Object ModeD 将 XML 文档 作为 一 棵 树 状 结构 进行 分 析 ， 获 取 节 点 的 

内 容 以 及 相关 属性 ， 或 是 新 增 、 删 除 和 修改 节点 的 内 容 。XML 解析 器 在 加 载 XML 文件 
以 后 ，DOM 模式 将 XML 文件 的 元 素 视 为 一 个 树 状 结构 的 节点 ， 一 次 性 读 入 内 存 。 如 果 
文档 比较 大 ， 解 析 速 度 就 会 变 慢 。 但 是 DOM 模式 有 一 点 是 SAX 无 法 取代 的 ， 那 就 是 
DOM 能 够 修改 XML 文档 。 

Python 标准 库 中 提供 了 支持 SAX 和 DOM 的 XML 模块 ， 但 同时 Python 也 提供 了 另外 
一 个 兼顾 SAX 和 DOM 优点 的 XML 模块 一 -ElementTree，ElementTree 就 像 一 个 轻 量 级 
的 DOM， 可 以 读 写 XML 文档 ， 具 有 方便 友好 的 API， 且 执行 速度 快 ， 消 耗 内 存 少 。 目 前 
ElementTree 是 解析 和 生成 XML 的 最 好 选择 ， 本 章 重点 介绍 ElementTree 模块 的 使 用 。 

下 面 通过 一 个 示例 介绍 ElementTree 模块 的 基本 使 用 。 现 在 有 一 个 记录 备 忘 信息 的 Notes. 
xml 文件 ， 它 的 内 容 如 下 。 通 过 ElementTree 读 取 所 有 Note 元 素 信息 。 


<?xml version="1.0" encoding="UTF-8"?> 
<Notes> 

<Note id="1"> 
<CDate>2018-3-21</CDate> 
<Content> 发 布 Python0</Content> 
<UserID>tony</UserID> 

</Note> 

<Note id="2"> 
<CDate>2018-3-22</CDate> 
<Content> 发 布 Python1</Content> 
<UserID>tony</UserID> 

</Note> 

<Note id="3"> 
<CDate>2018-3-23</CDate> 
<Content> 发 布 Python2</Content> 
<UserID>tony</UserID> 

</Note> 

<Note id="4"> 
<CDate>2018-3-24</CDate> 
<Content> 发 布 Python3</Content> 
<UserID>tony</UserID> 

</Note> 

<Note id="5"> 
<CDate>2018-3-25</CDate> 
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<Content> 发 布 Python4</Content> 
<UserID>tony</UserID> 
</Note> 
</Notes> 


示例 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter16/16.2/ch16.2.2.py 


import xml.etree.ElementTree as ET (0) 


© 


tree = ET.parse('data/Notes.xml') # 创建 XML 文档 树 
print(type(tree)) # xml.etree.ElementTree.ElementTree 


root = tree.getroot () # root 是 根 元 素 
Print(type (root)) # xml.etree.ElementTree.Element 
Print (root.tag) # Notes 


@ 
四 
for index, child in enumerate (root): 回 
print('" 第 {0} 个 {1} 元 素 ， 属 性 : {2}'.format (index, child.tag, child.attrib)) 
for i, child child in enumerate (child) : @ 
print(' 标签 : {0}， 内 容 : {1}'.format (child child.tag, child child.text)) 


输出 结果 如 下 : 


<class 'xml.etree.ElementTree.ElementTree'> 

<class 'xml.etree.ElementTree.Element'> 

Notes 

第 0 个 Note 元 素 ， 属 性 : {'id': '1'} 
标签 : CDate， 内 容 : 2018-3-21 
标签 : Content， 内 容 : 发 布 Python0 
标签 : UserID， 内 容 : tony 

第 1 个 Note 元 素 ， 属 性 : {'id': '2'} 
标签 : CDate， 内 容 : 2018-3-22 
标签 : Content， 内 容 ; 发 布 Pythonl 
标签 : UserID， 内 容 : tony 

第 2 个 Note 元 素 ， 属 性 : {'id': '3'} 
标签 : CDate， 内 容 : 2018-3-23 
标签 : Content， 内 容 : 发 布 Python2 
标签 : UserID， 内 容 : tony 

第 3 个 Note 元 素 ， 属性: {'id': '4'} 
标签 : CDate， 内 容 : 2018-3-24 
标签 : Content， 内 容 : 发 布 Python3 
标签 : UserID， 内 容 : tony 

第 4 个 Note 元 素 ， 属 性: {'id': '5"'} 
标签 : CDate， 内 容 : 2018-3-25 
标签 : Content， 内 容 : 发 布 Python4 
标签 : UserID， 内 容 : tony 


上 述 代 码 第 四 行 是 导入 xml.etree.ElementTree 模块 。 代 码 第 @ 行 通过 parse0 函数 创建 
XML 文档 树 tree，parse0 函数 的 参数 可 以 是 一 个 表示 XML 文件 的 字符 串 ， 也 可 以 是 XML 
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文件 对 象 。 函 数 返 回 值 类 型 是 xml.etree.ElementTree.ElementTree 类 型 ， 它 表示 整个 的 XML 
文档 树 。 代 码 第 图 行 tree.getroot() 方法 是 从 tree 获 得 它 的 根 元 素 ， 它 的 类 型 是 xmletree. 
ElementTree.Element， 它 是 所 有 元 素 的 类 型 。 代 码 第 @ 行 tag 属性 可 以 获得 当前 元 素 的 标签 
名 。 代 码 第 @ 行 是 遍历 根 元 素 ，enumerate() 函数 可 以 获得 循环 变量 index， 注 意 此 时 的 child 
是 Node 元 素 。 代 码 第 @ 行 中 child.attrib 是 获得 当前 元 素 的 属性 ， 返 回 属性 和 值 的 字典 。 由 
于 代码 第 @ 行 的 for 循环 只 是 遍历 了 Note 元 素 ， 如 果 还 想 人 遍历 它 的 子 元 素 还 需要 使 用 for 循 
环 遍历 。 代 码 第 @ 行 遍历 Note 子 元 素 。 代 码 第 @ 行 中 child_child.tag 是 获得 子 元 素 的 标签 名 ， 
child_child.text 是 获得 子 元 素 的 文本 内 容 。 


16.2.3 XPath 


在 上 一 节 的 示例 是 从 根 元 素 开 始 遍历 整个 的 XML 文档， 实际 开发 时 ， 往 往 需要 查找 某 些 
特殊 的 元 素 或 某 些 特 殊 属性 。 这 需要 使 用 xml.etree.ElementTree.Element 的 相关 find 方法 ， 还 
要 结合 XPath 匹配 查找 。 

xml.etree.ElementTree.Element 的 相关 find 方法 有 如 下 三 种 。 

1) find(match, namespaces=None) 

查找 匹配 的 第 一 个 子 元 素 。match 可 以 是 标签 名 或 XPath， 返 回 元 素 对 象 或 None。 
namespaces 是 指定 命名 空间 ， 如 果 namespaces 非 空 ， 那 么 查找 会 在 指定 的 命名 空间 的 标签 中 
进行 。 

2) findall(match, namespaces=None) 

查找 所 有 匹配 的 子 元 素 ， 参 数 同 find0 方法 。 返 回 值 是 符合 条 件 的 元 素 列表 。 

3) findtext(match, default=None, namespaces=None) 

查找 匹配 的 第 一 个 子 元 素 的 文本 ， 如 果 未 找到 元 素 ， 则 返回 默认 。default 参数 是 默认 值 ， 
其 他 参数 同 find() 方法 。 

那么 什么 是 XPath 呢 ? XPath 是 专门 用 来 在 XML 文档 中 查找 信息 的 语言 。 如 果 说 XML 
是 数据 库 ， 那 么 XPath 就 是 SQL 语言 ?。XPath 将 XML 中 的 所 有 元 素 、 属 性 和 文本 都 看 作 节 
点 (Node)， 根 元 素 就 是 根 节点 ， 它 没有 父 节 点 ， 属 性 称 为 属性 节点 ， 文 本 称 为 文本 节点 。 除 
了 根 节点 外 ， 其 他 节点 都 有 一 个 父 节 点 ， 零 或 多 个 子 节点 和 兄弟 节点 。 

XPath 提供 了 由 特殊 符号 组 成 的 表达 式 ，XPath 表达 式 如 表 16-1 所 示 。 


表 16-1 XPath 表达 式 


表 达 式 例 子 
nodename 选择 nodename 子 节点 
: 选择 当前 节点 -/Note 当前 节点 下 的 所 有 Note 子 节点 
/ 路 径 指示 符 ， 相 当 于 目录 分 隔 符 | ./Note/CDate 表示 所 有 Note 子 节点 下 的 CDate 节点 
选择 父 节 点 -Note/CDate/.. 表示 CDate 节点 的 父 节 点 ， 其 实 就 是 
Note 节点 
点 点 
/ 所 有 后 代 季 点 《包括 子 节 点 、 | .cpate 表示 当前 节点 中 查找 所 有 的 CDate 后 代 节点 


孙 节 点 等 ) 


@ 结构 化 查询 语言 (Structured Query Language, SQL) 提 供 了 一 套用 来 输入 、 更 改 和 查看 关系 数据 库 内 容 的 命令 。 


206 所 | Python 从 小 白 到 大 牛 


表 达 式 例 子 
[@attrib] 选择 指定 属性 的 所 有 节点 -/Note[@id] 表示 有 id 属性 的 所 有 Note 节点 


选择 指定 属性 等 于 value 的 所 有 


节点 .Note[@id=-'1] 表示 有 id 属性 等 于 '1' 的 所 有 Note 节点 


[@attrib='value'] 


./Note[1] 表示 第 一 个 Note 节点 ，./Note[last0] 表示 最 后 
一 个 Note 节点 ，./Note[last0-1] 表示 倒数 第 2 个 Note 
节点 


指定 位 置 ， 位置 从 1 开始， 最 
后 一 个 可 以 使 用 lastO 获取 


[position] 


XPath 表达 式 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter16/16.2/ch16.2.3.py 


import xml.etree.ElementTree as ET 


tree = ET.parse('data/Notes.xml') 
root = tree.getroot() 


node = root.find("./Note") # 当前 节点 下 的 第 一 个 Note 子 节点 

print (node.tag, node.attrib) 

node = root.find("./Note/CDate") # Note 子 节点 下 的 第 一 个 CDate 节点 

print (node .text) 

node = root.find("./Note/CDate/..") # Note 节点 

print (node.tag, node.attrib) 

node = root.find(".//CDate") # 当前 节点 查找 所 有 后 代 节点 中 第 一 个 CDate 节点 


print (node .text) 


node = root.find("./Note[eid]") # 具有 id 属性 的 Note 节点 
print (node.tag, node.attrib) 


node = root.find("./Note[@id='2']") # id 属性 等 于 '2' 的 Note 节点 
print (node.tag, node.attrib) 


node = root.find("./Note[2]") # 第 二 个 Note 节点 
print (node.tag, node.attrib) 


node = root.find("./Note[last()]") # 最 后 一 个 Note 节点 
print (node.tag, node.attrib) 


node = root.find("./Note[last ()-2]") # 倒数 第 三 个 Note 节点 
print (node.tag, node.attrib) 

输出 结果 如 下 : 

Note (fa "1"y 

2018-3-21 

Note "4d"s "1°Yy 

2018-3-21 


Note {'id’: '1°'} 
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Note {f"id': '2'} 
Note {'id': '2°'} 
Note {'id': '5'} 
Note {'id': '3'} 


上 述 代 码 使 用 find0 方法 只 返回 符合 匹配 条 件 的 第 一 个 节点 元 素 。 


16.3 JSON 数据 交换 格式 


JSON (JavaScript Object Notation) 是 一 种 轻 量 级 的 数据 交换 格式 。 所 谓 轻 量 级 ， 是 与 办 
XML 文档 结构 相 比 而 言 的 。 描 述 项 目的 字符 少 ， 所 以 描述 相同 数据 所 需 的 字符 个 数 要 少 ， 那 氏 
么 传输 速度 就 会 提高 ， 而 流量 也 会 减少 。 Be 


16.3.1 JSON 文档 结构 


由 于 Web 和 移动 平台 开发 对 流量 的 要 求 是 尽 可 能 少 ， 对 速度 的 要 求 是 尽 可 能 快 ， 而 轻 量 
级 的 数据 交换 格式 JSON 就 成 为 理想 的 数据 交换 格式 。 

构成 JSON 文档 的 两 种 结构 为 对 象 (objecb 和 数组 (array) 。 对 象 是 “名 称 : 值 ”对 集合 ， 
它 类 似 于 Python 中 Map 类 型 ， 而 数组 是 一 连 串 元 素 的 集合 。 

JSON 对 象 (objecb 是 一 个 无 序 的 “名 称 / 值 ” 对 集合 ， 一 个 对 象 以 “ { ”开始 ， 以 “ }?” 
结束 。 每 个 “名 称 ” 后 跟 一 个 “ :”%“ 名 称 : 值 ”对 之 间 使 用 “ ,” 分 隔 ,“ 名 称 ” 是 字符 串 类 
型 (string),“ 值 ”可 以 是 任何 合法 的 JSON 类 型 。JSON 对 象 的 语法 表 如 图 16-5 所 示 。 


图 16-5 JSON 对 象 的 语法 表 


下 面 是 一 个 JSON 对 象 的 例子 : 


{ 
"name":"a.htm", 
"size":345, 
"saved":true 


} 


JSON 数组 (array) 是 值 的 有 序 集合 ， 以 “[” 开 始 ， 以 “] ”结束 ， 值 之 间 使 用 “, ”分隔 。 
JSON 数组 的 语法 表 如 图 16-6 所 示 。 


PR 


图 16-6 JSON 数组 的 语法 表 
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下 面 是 一 个 JSON 数组 的 例子 : 


["text", "html", "css"] 


在 数组 中 ， 值 可 以 是 双 引 号 括 起 来 的 字符 串 、 数 字 、true、false、null、 对 象 或 者 数组 ， 而 
且 这 些 结构 可 以 嵌 套 。 数 组 中 值 的 JSON 语法 结构 如 图 16-7 所 示 。 


图 16-7 JSON 值 的 语法 结构 图 


16.3.2 JSON 数据 编码 


在 Python 程序 中 要 想 将 Python 数据 网 络 传输 和 存储 ， 可 以 将 Python 数据 转换 为 JSON 数 
据 再 进行 传输 和 存储 ， 这 个 过 程 称 为 “编码 ”Cencode) 。 
在 编码 过 程 中 Python 数据 转换 为 JSON 数据 的 映射 关系 如 表 16-2 所 示 。 


表 16-2 Python 数据 与 JSON 数据 的 映射 关系 


Python JSON 
字典 对 象 
列表 、 元 组 数组 
字符 串 字符 串 
整数 、 浮 点 等 数字 类 型 数字 


True 


False 


None 


注意 : JSON 数据 在 网 络 传输 或 保存 到 磁盘 中 时 ， 推 荐 使 用 JSON 对 象 ， 偶 尔 也 使 用 JSON 
数组 。 所 以 一 般 情 况 下 只 有 Python 的 字典 、 列 表 和 元 组 才 需 要 编码 ，Python 字典 编码 JSON 
对 象 ; Python 列表 和 元 组 编码 JSON 数组 。 


Python 提供 的 内 置 模块 json 可 以 帮助 实现 JSON 的 编码 和 解码 ，JSON 编码 使 用 dumps() 
和 dump() 函数 ，dumps() 函数 将 编码 的 结果 以 字符 串 形式 返回 ，dump() 函数 将 编码 的 结果 保 
存 到 文件 对 象 (类 似 文 件 对 象 或 流 ) 中 。 

下 面具 体 介绍 一 下 JSON 数据 编码 过 程 ， 示 例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter16/ch16.3.2.py 


import json 
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# 准备 数据 
py_dict = {'name': 'tony', 'age': 30, 'sex': True} # 创建 字典 对 象 
py_list = [1, 3] # 创建 列表 对 象 
py_tuple = ('A', 'B', 'C') # 创建 元 组 对 象 
py_dict['a'] = py_list # 添加 列表 到 字典 中 
py_dict['b'] = py_tuple # 添加 元 组 到 字典 中 
print (py_dict) 
print(type(py_dict)) # <class 'dict'> 
# 编码 过 程 
json_obj = json.dumps (py_dict) [oy 
print (json_obj) 
print(type(json obj)) # <class 'str'> 
# 编码 过 程 
json_ obj = json.dumps (py _dict, indent=4) @ 
# 输出 格式 化 后 的 字符 串 
print (json_ obj) 
# 写 入 JSON 数据 到 datal.json 文件 
with open('data/datal.json'，'w') as f: 
json.dump (Py_dict，f) 四 
# 写 入 JSON 数据 到 data2.json 文件 
with open('data/data2.json', 'w') as f: 
json.dump(py_dict, f, indent=4) 四 
输出 结果 如 下 : 
Ti Eo a 3 "er Tn i 2 3 hs Mr A WOM 
<class 'dict'> 
("mam "Eon "ge" 30% a trow, "a" [i Sr "bs [NM “Bs "CE" 


<class 'str'> 


{ 


"nam 


和 


"tony", 


SO 


true, 
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中 ， 


上 述 代码 第 @ 行 是 对 Python 字典 对 象 py_dict 进行 编码 ， 编 码 的 结果 是 返回 字符 串 ， 这 个 
字符 串 中 没有 空格 和 换行 等 字符 ， 可 见 减少 字 节 数 适合 网 络 传输 和 保存 。 代 码 第 @ 行 也 是 对 
Python 字典 对 象 py_dict 进行 编码 ， 在 dumps() 函数 中 使 用 了 参数 indent。indent 可 以 格式 化 
字符 串 , indent=4 表示 缩 进 4 个 空格 ， 这 种 漂亮 的 格式 化 的 字符 串 ， 主 要 用 于 显示 和 日 志 输 出 ， 
但 不 适合 网 络 传输 和 保存 。 代 码 第 @ 行 和 第 @ 行 是 dump() 函数 将 编码 后 的 字符 串 保 存 到 文件 


dump() 与 dumps0 函数 具有 类 似 的 参数 ， 这 里 不 再 歼 述 。 
16.3.3 ”JSON 数据 解码 


编码 的 相反 过 程 是 “解码 ”(decode)， 即 将 JSON 数据 转换 为 Python 数据 。 从 网 络 中 接收 
或 从 磁盘 中 读 取 JSON 数据 时 ， 需 要 解码 为 Python 数据 。 


在 编码 过 程 中 ，JSON 数据 转换 为 Python 数据 的 映射 关系 如 表 16-3 所 示 。 
表 16-3 JSON 数据 与 Python 数据 的 映射 关系 


JSON 了 Python 
对 象 字典 
数组 列表 
字符 串 字符 串 
整数 数字 整数 
实数 数字 浮 点 
true True 
false False 
null None 


json 模块 提供 的 解码 函数 是 10ads() 和 1oad()，loads() 函数 将 JSON 字符 串 数据 进行 解 
码 ， 返 回 Python 数据 ，load() 函数 读 取 文件 或 流 ， 对 其 中 的 JSON 数据 进行 解码 ， 返 回 结果 为 
Python 数据 。 


下 面具 体 介 绍 JSON 数据 解码 过 程 ， 示 例 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapterl6/ch16.3.3.py 


import json 


# 准备 数据 

json_obj = r'{"name": "tony", "age": 30, "sex": true, "a": [1, 3] 
,ny O 
py_dict = json.loads (json_obj) @ 


print (type(py dict)) # <class 'dict'> 
print (py_dict['name']) 

print (py_dict['age']) 

print (py_dict['sex"']) 


py_lista = py_dict['a'] # 取出 列表 对 象 
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print (py_lista) 
py_listb = py dict['b'] # 取出 列表 对 象 
print (py_listb) 


# 读 取 JSON 数据 到 data2 .json 文件 

with open('data/data2.json', 'r') as f: 
data = json.load(f) @ 
print (data) 
print(type(data)) # <class 'dict'> 


上 述 代 码 实现 了 从 字符 串 和 文件 中 解码 JSON 数据 。 代 码 第 @ 行 是 一 个 表示 JSON 对 象 的 
字符 串 。 代 码 第 @ 行 是 对 JSON 对 象 字符 串 进行 解码 ， 返 回 Python 字典 对 象 。 代 码 第 @ 行 是 从 
data2.json 文件 中 读 取 JSON 数据 解析 解码 ， 返 回 Python 字典 对 象 。data2.json 文件 内 容 如 下 : 


{ 
"name": "tony", 
"age": 30, 


"sex":; true, 


从 data2.json 文件 内 容 可 见 ， 其 中 有 很 多 换行 符 和 空格 符 等 ， 这 些 字符 在 解析 时 都 被 忽 
略 掉 了 。 


注意 : 如 果 按 照 规 范 的 JSON 文档 要 求 ， 每 个 JSON 数据 项 的 “名 称 ” 必 须 使 用 双 引 号 括 
起 来 ， 而 且 数 值 中 的 字符 串 也 必须 使 用 双 引 号 括 起 来 。 在 下 面 的 JSON 数据 中 ， 有 的 “名 称 ” 
省 略 了 双 引 号 ， 有 的 “名 称 ” 使 用 了 单 引 号 ， 字 符 串 表示 也 不 规范 ， 该 JSON 数据 使 用 json 模 
块 解析 时 会 出 现 异常 ， 或 许 有 第 三 方 库 可 以 解析 ， 但 这 并 不 是 规范 的 做 法 。 


Resultcode: 0, 
Record: [ 
{ 
和 
'CDate': '2018-8-23°', 
'Content': ' 发 布 PythonBook0'， 
'UserID': "tony" 


1ID': 121, 
"CDate': '2018-8-24", 
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'Content': 发布 PYthonBookl' 
"UserID': 'tony' 
3 
] 
} 
16.4 配置 文件 


在 Windows 平台 经 常 使 用 一 种 ini 文件 (Initialization File)， 它 是 Windows 系统 配置 文件 
所 采用 的 存储 格式 ， 也 称 为 配置 文件 。 虽 然 是 Windows 系统 配置 ， 但 也 可 以 应 用 于 其 他 平台 
区 作为 数据 交换 格式 。 

提示 : 如 果 单 纯 为 Python 程序 提供 配置 信息 ， 那 么 完全 可 以 使 用 一 个 Python 源 程序 文件 
作为 配置 文件 ， 因 为 Python 是 解释 性 语言 ， 直 接 读 取 源 文件 内 容 。 如 果 为 了 数据 交换 或 保存 
数据 ，ini 配置 文件 是 很 方便 的 。 


16.4.1 ”配置 文件 结构 


配置 文件 采用 键 值 对 数据 结构 ， 可 以 进行 少量 的 数据 交换 和 存储 。 如 图 16-8 所 示 是 一 个 
配置 文件 ， 其 中 包括 节 、 配 置 项 和 注释 。 节 中 包括 若干 配置 项 ， 配 置 项 由 键 值 对 构成 ， 默 认 情 
况 下 键 和 值 用 等 号 进行 分 隔 。 注 释 使 用 分 号 “; ”， 注 释 要 独占 一 行 。 


回国 


;Startup # 

[startup] 

|Require0s = Windows 26696 

RequireMSI = 3.0 配置 项 
RequireIE = 6.9.2690.9 


;Product 芳 
一 一 一 [Product] 


msi = AcroRead .msi 
;Windows 2000 芳 
[windows 2666] 


|PLatformID = 2 

了 去 眠 承 呈 
MajorVersion = 5 
ServicePackMajor = 4 


mh 
入 


图 16-8 配置 文件 结构 


16.4.2 ” 读 取 配 置 文件 


Python 标准 库 中 提供 了 对 配置 文件 读 写 的 模块 一 一 configparser。configparser 模块 中 提 
供 了 一 个 配置 解析 器 类 ConfigParser， 通 过 ConfigParser 的 相关 方法 可 以 实现 对 配置 文件 读 
写 操作 。 

下 面 通过 一 个 示例 介绍 读 取 配置 文件 ， 该 示例 是 从 图 16-8 所 示 的 配置 文件 中 读 取 信息 ， 
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示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ;chapter16/16.4/ch16.4.2.py 


import configparser 


config = configparser.ConfigParser () # 创建 配置 解析 器 对 象 @ 
config.read('data/Setup.ini', encoding='utf-8') # 读 取 并 解析 配置 文件 @ 
print (config.sections ()) # 返回 所 有 的 节 @ 
sectionl = config['Startup'] # 返回 Startup 节 @ 
print (config.options('Startup')) © 
print (sectionl['RequireO0S']) 
print (sectionl['RequireIE']) 

print(config['Product'] ['msi']) @ 
print (config['Windows 2000']['MajorVersion']) # 返回 MajorVersion 数据 
print(config['Windows 2000']['ServicePackMajor']) 

value = config.get ('Windows 2000', 'MajorVersion') # 返回 MajorVersion 数据 


print(type (value)) # <class 'str'> 


value = config.getint('Windows 2000', 'MajorVersion') # 返回 MajorVersion 数据 四 
print(type (value)) # <class ‘'int'> 


输出 结果 如 下 : 


['Startup', 'Product', 'Windows 2000'] 
['requireos', 'requiremsi', 'requireie'] 
Windows 2000 

6.0.2600.0 

AcroRead.msi 

5 

4 

<class 'str'> 

<class 'int'> 


上 述 代码 第 @ 行 是 创建 配置 解析 器 对 象 。 代 码 第 @ 行 通过 配置 解析 器 对 象 的 read() 方法 读 
取 并 解析 配置 Setup.ini，encoding='utf-8' 是 指定 读 取 文件 字符 集 为 UTF-8， 注 意 如 果 文 件 中 有 
中 文 (包括 注释 )， 则 必须 正确 指定 字符 集 ， 否 则 会 有 解析 错误 。 

代码 第 @ 行 config.sections( 返回 文件 中 所 有 的 节 。 代 码 第 图 行 返回 Startup 节 对 象 。 代 
码 第 @ 行 config.options('Startup') 返回 Startup 节 中 所 有 配置 项 。 代 码 第 @ 行 是 读 取 Startup 节 
中 键 RequireOS 对 应 的 值 。 而 代码 第 @ 行 采用 config['Product]['msi] 形式 读 取 Product 节 中 键 
msi 对 应 的 值 。 

代码 第 @ 行 、 第 @ 行 和 第 多 行 都 是 读 取 Windows 2000 节 中 键 MajorVersion 对 应 的 值 。 代 
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码 第 @ 行 通过 get() 方法 读 取 数 据 ， 它 的 返回 值 是 字符 串 ; 代码 第 @ 行 通过 getint() 方法 读 取 数 
据 ， 它 的 返回 值 是 整数 类 型 。 类 似 的 方法 还 有 getfloat() 和 getboolean() 方法 ,分别 返回 浮 点 和 
布尔 类 型 数据 。 


16.4.3” 写 人 配置 文件 


使 用 configparser 模块 不 仅 可 以 读 取 配 置 文件 信息 ， 还 可 以 写 入 配置 信息 ， 写 入 配置 信息 
包括 更 新 节 和 配置 项 ， 以 及 添加 节 和 配置 项 。 
写 入 配置 文件 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter16/16.4/ch16.4.3.py 


import configparser 
config = configparser.ConfigParser () # 创建 配置 解析 器 对 象 
config.read('data/Setup.ini'，encoding='utf-8') # 读 取 并 解析 配置 文件 


# 写 入 配置 文件 
config['Startup'] ['RequireMSI'] = '8.0"' 


config['Product'] ['RequireMSI'] = '4.0' 


config.add section('Section2') # 添加 节 
config.set ('Section2', 'name', 'Mac') # 添加 配置 项 


with open('data/Setup.ini'，'w'") as fw: 


©@@ ee © © 


config .write (fw) 


上 述 代码 第 @ 行 是 更 新 Startup 节 中 RequireMSI 配置 项 目 。 代 码 第 @ 行 是 添加 Product 节 
中 RequireMSI 配置 项 。 代 码 第 @ 行 是 添加 一 个 新 节 Section2， 如 果 Section2 已 经 存在 则 会 发 
送 异 常 。 代 码 第 @ 行 为 Section2 添加 配置 项 。 代 码 第 @ 行 以 写 入 模式 打开 配置 文件 ， 代 码 第 @ 
行 写 入 配置 文件 。 


本 章 小 结 


本 章 主 要 介绍 了 Python 中 几 种 数据 交换 格式 CSV、XML、JSON， 以 及 配置 文件 等 格式 。 
其 中 XML 和 JSON 是 学 习 的 重点 ， 读 者 需要 熟练 掌握 解析 XML 数据 的 方法 ， 掌 握 JSON 的 
解码 和 编码 过 程 。 最 后 还 需 了 解 范围 CSV 文件 和 读 写 配置 文件 。 
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数据 必须 以 某 种 方式 存储 起 来 才 有 价值 ， 数 据 库 实 际 上 是 一 组 相关 数据 的 集合 。 例 如 ， 某 
个 医疗 机 构 中 所 有 信息 的 集合 可 以 被 称 为 一 个 “医疗 机 构 数据 库 ?， 这 个 数据 库 中 的 所 有 数据 
都 与 医疗 机 构 相 关 。 

数据 库 编程 的 相关 技术 有 很 多 ， 涉 及 具体 的 数据 库 安装 、 配 置 和 管理 ， 还 要 掌握 SQL 语 
句 ， 最 后 才能 编写 程序 访问 数据 库 。 本 章 重点 介绍 MySQL 数据 库 的 安装 和 配置 ， 以 及 Python 
数据 库 编程 和 NoSQL 数据 存储 技术 。 


17.1 数据 持久 化 技术 概述 


把 数据 保存 到 数据 库 中 只 是 一 种 数据 持久 化 方式 。 凡 是 将 数据 保存 到 存储 介质 中 ， 需 要 的 
时 候 能 再 找 出 来 ， 并 能 够 对 数据 进行 修改 ， 都 属于 数据 持久 化 。 

Python 中 数据 持久 化 技术 有 很 多 。 

1) 文本 文件 

通常 可 以 通过 Python 文件 操作 和 管理 技术 将 数据 保存 到 文本 文件 中 ， 然 后 进行 读 写 操作 ， 
这 些 文件 一 般 是 结构 化 的 文档 ， 如 XML、JSON 和 CSV 等 文件 。 结 构 化 文档 是 指 在 文件 内 部 
采取 某 种 方式 将 数据 组 织 起 来 的 文件 。 

2) 数据 库 

将 数据 保存 在 数据 库 中 是 不 错 的 选择 ， 数 据 库 的 后 面 是 一 个 数据 库 管 理 系统 ， 它 支持 事 
务 处 理 、 并 发 访问 、 高 级 查询 和 SQL 语言 。Python 中 将 数据 保存 到 数据 库 中 技术 有 很 多 ， 但 
主要 分 为 两 类 : 遵循 Python DB-API 规 范 技 术 ? 和 ORMS2 技 术 。Python DB-API 规 范 通过 在 
Python 中 编写 SQL 语句 访问 数据 库 ， 这 是 本 章 介 绍 的 重点 ; ORM 技术 是 面向 对 象 的， 对 数据 
的 访问 是 通过 对 象 实现 的 ， 程 序 员 不 需要 使 用 SQL 语句 ,Python ORM 技术 超出 了 本 书 的 范围 。 


数据 库 编程 


17.2 ”MySQL 数据 库 管 理 系统 


Python DB-API 规 范 一 定 会 依托 某 个 数据 库 管理 系统 (Database Management System， 四 


加 ”Python 官方 规范 PEP 249 (https://www.python.org/dev/peps/pep-0249/) ， 目 前 是 Python Database API Specification 
v2.0， 简 称 Python DB-API2。 

回 对象 关系 映射 (Object-Relational mapping，ORM) ， 它 能 将 对 象 保存 到 数据 库 表 中 ， 对 象 与 数据 库 表 结 构 
之 间 是 有 某 种 对 应 关系 的 。 
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DBMS)， 还 会 使 用 到 SQL 语句 ， 所 以 本 节 先 介绍 数据 库 管 理 系统 。 
数据 库 管理 系统 负责 对 数据 的 管理 、 维 护 和 使 用 。 现 在 主流 数据 库 管理 系统 有 Oracle、 


SQL Server、DB 2、Sysbase、MySQL 和 SQLite 等 ， 本 节 介 绍 MySQL 数据 库 管 理 系统 的 使 
用 和 管理 。 


提示 : Python 内 置 模块 提供 了 对 SQLite 数据 库 访问 的 支持 ， 但 SQLite 主要 是 嵌入 式 系统 
设计 的 ， 虽 然 SQLite 很 优秀 ， 也 可 以 应 用 于 桌面 和 Web 系统 开发 ， 但 数据 承载 能 力 有 些 差 ， 
并 发 访问 处 理性 能 也 比较 差 ， 因 此 本 书 没有 重点 介绍 MySQL 数据 库 。 


MySQL (https://www.mysql.com) 是 流行 的 开放 源码 SQL 数据 库 管 理 系 统 ， 它 由 MySQL 
AB 公司 开发 ， 先 被 Sun 公司 收购 ， 后 来 又 被 Oracle 公司 收购 ， 现 在 MySQL 数据 库 是 Oracle 
旗下 的 数据 库 产 品 ，Oracle 负责 提供 技术 支持 和 维护 。 


17.2.1 数据库 安 装 与 配置 


目前 Oracle 提供 了 多 个 MySQL 版 本 ， 其 中 社区 版 MySQL Community Edition 是 免费 的 ， 
社区 版 本 比较 适合 中 小 企业 数据 库 ， 本 书 也 对 这 个 版 本 进行 介绍 。 

社区 版 下 载 地 址 是 https://dev.mysql.com/downloads/windows/installer/5.7.html。 如 图 17-1 
所 示 ， 可 以 选择 不 同 的 平台 版 本 ，MySQL 可 在 Windows、Linux 和 UNIX 等 操作 系统 上 安装 
和 运行 。 本 书 选 择 的 是 Windows 版 中 的 mysql-installer-community-5.7.18.1.msi 安装 文件 。 


加 wsot:oomoxdw x 天 = i ep 
€ 3 © | wmvmprqcomwuomionlywindowvinalieus7hmm 让 | 三 区 @ 


Generally Available (GA) Releases Development Releases 


MySQL Installer 5.7.18 


Select Operating System Looking for previous GA 
verslons? 


Microsoft Windows 
Windows (x86, 32-bit), MSI Installer 57.18 18.5M Er 
(mysainstaller web-comemunity 5.7.18 .msi) Nos acc7asec6lc2dafba397501zfdecaed901 


ndows (x86, 32-bit)  MSI Installe 57.18 4058M 


si wps 3c4bfbc433c78fc082093d 


人 
et 


图 17-1 MySQL 数据 库 社 区 版 下 载 界面 


下 载 成 功 后 ， 可 以 双击 .msi 文件 启动 安装 过 程 ， 安 装 过 程 比 较 简单 ， 这 里 介绍 几 个 关键 步骤 。 

1) 安装 类 型 选择 

如 图 17-2 所 示 是 安装 类 型 选择 对 话 框 。 在 这 个 页 面 中 可 以 选择 安装 类 型 ， 有 5 种 安装 类 
型 : Developer Default (开发 者 安装 )、Server only (只 安装 服务 器 )、Client only (只 安装 客户 端 )、 
Full (全 部 安装 ) 和 Custom ( 自 定义 安装 ) 。 对 于 学 习 和 开发 而 言 可 以 选择 Developer Default 
安装 。 


MySQL Installer 


2) 安装 环境 检查 


Choosing a setup Type 


Please select the Setup Type that suits your use case. 


® Developer Defaut Sup Hpe Desciption 


Instal al products needed for 


WS Gevelopment purposes. 


“ MySQL for excel 


< Bock Net> 


SQL chient application to manage 
Servers and InnoDB custer nstanc 
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Cancel 


图 17-2 安装 类 型 选择 


在 Windows 下 安装 时 ， 由 于 Windows 版 本 的 多 样 性 ， 安 装 过 程 会 检查 版 本 需要 ， 缺 少 
的 Windows 安装 包 安 装 过 程 会 给 出 提示 。 如 图 17-3 所 示 ， 安 装 MySQL Server 需要 Microsoft 
Visual C++ 2013 Runtime， 则 需要 到 微软 网 站 下 载 Microsoft Visual C++ 2013 Runtime 安装 包 ， 
安装 好 Microsoft Visual C++ 2013 Runtime 后 ， 再 重新 安装 MySQL。 


MySQL Installer 


nity 


3) 配置 过 程 


Check Requirements 


Thefolowng products have faiing requrements. The installer wil attemptto resolve some 
marked 8 manusl cannot be resolved automabcally. 


of this automatcally. 
Chick on those tems to try and resokve them manually, 


For Product Requwement 

O MysQL Sever $7.18 Microsoft Visual C»» 2013 Runtime. 
O MysQL Workbench 639 Microsoft Visual C-* 2015 Runtime. 
) MySQL for Visual Studio 127 。 Visual Studio version 2012, 2013, 20. 


O MYSQL Unilities 1.65 
OMysAl shell 109 

O 〇 MySQL Router 2.13 
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Microsoht Visual C+» 2013 Runtime. 


Python 34 is not installed 


Microsoft Visual C+ 2013 Runtime.. 


Microsoft Visual C+» 2015 Runtime_- 


Manual 


<Bd || Becue | 


Net> | [ Cancel 


图 17-3 ”安装 环境 检查 


所 需要 的 文件 安装 完成 后 ， 就 会 进入 MySQL 的 配置 过 程 。 如 图 17-4 所 示 是 数据 库 类 型 
选择 对 话 框 ，Standalone 是 单个 服务 器 ，innoDB Cluster 是 数据 库 集群 。 
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MySQL. Installer 
MySQL Server 5718 


Type and Networking 


az- 


= 


Clent ApP 


Cancel 


图 17-4 数据 库 类 型 选择 对 话 框 


在 图 17-4 所 示 的 对 话 框 中 选择 Standalone， 单 击 Next 按钮 进入 如 图 17-5 所 示 的 服务 器 配 
置 类 型 选择 对 话 框 。 在 这 里 可 以 选择 配置 类 型 、 通 信 协 议和 端口 等 ， 单 击 Config Type 下 拉 列 


表 可 以 选择 如 下 的 配置 类 型 。 
图 MySsQL nstaller 


MySQL Installer 


Type and Networking 
Save Configuntion Iype 


Use the folowng controls to seiect how you would tlie to connect to thes server 
Top 
回 Open Frewall port for network eccess 


PonNumber [1505] 


Advanced Confguraton 
Select the checkbor below to get addibonal configuration page where you can set sdvanced 
opbons for th server nstance 
DD Show Advanced Options 
cha | re ere 


图 17-5 服务 器 配置 类 型 对 话 框 


。Development Machine (开发 机 器 ) : 该 选项 代表 典型 个 人 用 桌面 工作 站 ， 假 定 机 器 上 运 


行 着 多 个 桌面 应 用 程序 ， 会 将 MySQL 服务 器 配置 成 使 用 最 少 的 系统 资源 。 


。 Server Machine (服务 器 ): 该 选项 代表 服务 器 ，MySQL 服务 器 可 以 同 其 他 应 用 程序 一 起 
运行 ， 例 如 FTP、email 和 web 服务 器 ， 会 将 MySQL 服务 器 配置 成 使 用 适当 比例 的 系 


统 资源 。 
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。Dedicated Machine (专用 MySQL 服务 器 ) : 该 选项 代表 只 运行 MySQL 服务 的 服务 器 ， 
假定 没有 运行 其 他 应 用 程序 ， 会 将 MySQL 服务 器 配置 成 使 用 所 有 可 用 系统 资源 。 
根据 自己 的 需要 选择 配置 类 型 ， 其 他 的 配置 项 目 保 持 默认 值 ， 单 击 Next 按钮 进入 如 图 
17-6 所 示 的 账号 和 用 户 角色 设置 对 话 框 。 
在 图 17-6 所 示 的 对 话 框 中 可 以 进行 root 密码 设置 ， 以 及 添加 其 他 账号 等 操作 。root 密码 
必须 是 4 位 以 上 。 此 外 ， 还 可 以 单 击 Add User 按钮 添加 其 他 的 账号 。 


图 17-6 账号 和 用 户 角 色 设 置 对 话 框 


在 图 17-6 的 对 话 框 设置 完成 后 ， 单 击 Next 按钮 进入 如 图 17-7 所 示 的 配置 Windows 服务 
对 话 框 ， 在 这 里 可 以 将 MySQL 数据 库 配 置 成 为 一 个 Windows 服务 ，Windows 服务 可 以 在 后 
台 随 着 Windows 的 启动 而 启动 ， 不 需要 人 为 干预 。 其 默认 的 服务 名 是 MySQL57。 


图 wysQt mstaller 


MySQL. Installer Windows Service 
让 回 Configure MySQL Server as a Windows Service 


Windows Service Details 
Ple 


Windows Sevice Name [MySQL57 


回 Start the MySQL Server at System Starup 


图 17-7 配置 Windows 服务 对 话 框 
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在 图 17-7 所 示 配 置 界面 完成 后 ， 不 需要 再 进行 其 他 配置 了 ， 只 需要 单 击 Next 按钮 ， 这 里 
不 再 装 述 。 


17.2.2 ”连接 MySQL 服务 器 


由 于 MySQL 是 C/S (客户 端 /服务 器 ) 结构 的 ， 所 以 应 用 程序 包括 它 的 客户 端 必须 连接 到 
服务 器 才能 使 用 其 服务 功能 。 下 面 主要 介绍 MySQL 客户 端 如 何 连接 到 服务 器 。 
1. 快速 连接 服务 器 方式 
MySQL for Windows 版 本 提供 一 个 菜单 项 目 可 以 快速 连接 服务 器 ， 打 开 过 程 为 右 击 屏幕 左 
下 角 的 Windows 图 标 瞪 ， 在 “最 近 添 加 ”中 找到 MySQL 5.7 Command Line Client， 则 会 打开 
-个 终端 窗口 ， 对 话 框 如 图 17-8 所 示 。 


丽 MysQL 5.7 Command Line Client 口 SE 


图 17-8 MySQL 命令 行 客户 端 


这 个 工具 就 是 MySQL 命令 行 客户 端 工具 ， 可 以 使 用 MySQL 命令 行 客户 端 工具 连接 到 
MySQL 服务 器 ， 然 后 输入 root 密码 。 输 入 root 密码 后 按 Enter 键 ， 如 果 密 码 正确 则 连接 到 
MySQL 服务 器 ， 如 图 17-9 所 示 。 


MysQL 5.7 Command Line Client 


图 17-9 使 用 命令 行 客户 端 连接 到 服务 器 
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2. 通用 的 连接 方式 

快速 连接 服务 器 方式 下 连接 的 是 本 地 数据 库 ， 如 果 服 务 器 不 在 本 地 ， 而 是 在 一 个 远程 主机 
上 ， 那 么 需要 使 用 通用 的 连接 方式 。 

首先 在 操作 系统 下 打开 一 个 终端 窗口 ，Windows 下 是 命令 行 工具 ， 再 次 输入 mysql -h 
localhost -u root -p 命令 。 如 图 17-10 所 示 ， 如 果 出 现 “ 'MySQL' 不 是 内 部 或 外 部 命令 ， 也 不 
是 可 运行 的 程序 或 批 处 理 文件 .” 的 错误 ， 则 说 明 在 环境 变量 的 Path 没有 配置 MySQL 的 Path 。 
这 时 需要 追加 C:\Program Files\MySQL\IMySQL Server 5.7\bin 到 环境 变量 Path 之 后 。 


图 17-10 ”环境 变量 中 没有 MySQL 的 Path 


如 果 Path 环境 变量 添加 成 功 ， 重 新 打开 命令 行 ， 再 次 输入 mysql -h localhost -u root -p 命 
， 系 统 会 提示 输入 root 密码 。 输 入 密码 后 按 下 Enter 键 ， 如 果 密 码 正 确 会 成 功 连接 到 服务 
， 如 图 17-9 所 示 的 界面 。 


提示 : mysql -h localhost -u root p 命令 参数 说 明 

-h 既是 要 连接 的 服务 器 主机 名 或 JP 地 址 ， 也 可 以 是 远程 的 一 个 服务 器 主机 ，-h localhost 
也 可 以 表示 为 -hlocalhost 形式 ， 即 没有 空格 

-U 是 服务 器 要 验证 的 用 户 名 ,这 个 用 户 一 定 是 数据 库 中 存在 的 ， 并 且 具 有 连接 服务 器 的 权 
限 。-u root 也 可 以 表示 为 -uroot 形式 

-p 既是 与 上 面 用 户 对 应 的 密码 ， 也 可 以 直接 输入 密码 -p123456，123456 是 root 密码 

所 以 mysql -h localhost -u root -p 命令 也 可 以 替换 为 mysql -hlocalhost -uroot -p123456 


莫 少 


17.2.3 ”常见 的 管理 命令 

通过 命令 行 客户 端 管理 MySQL 数据 库 ， 需 要 了 解 一 些 常用 的 命令 。 

1. help 

第 一 个 应 该 熟悉 的 就 是 help 命令 ，help 命令 能 够 列 出 MySQL 其 他 命令 的 帮助 。 在 命 
令 行 客户 端 中 输入 help， 不 需要 分 号 结尾 ， 直 接 按 下 Enter 键 ， 如 图 17-11 所 示 。 这 里 都 是 
MySQL 的 管理 命令 ， 这 些 命令 大 部 分 不 需要 分 号 结尾 

2 nd 

命令 行 客户 端 中 退出 ， 可 以 在 命令 行 客户 端 中 使 用 quit 或 esit 命令， 如 图 17-12 所 示 。 

dled end 
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图 17-11 使 用 help 命令 


图 17-12 使 用 退出 命令 


3. 数据 库 管理 

在 使 用 数据 库 的 过 程 中 ， 有 时 需要 知道 数据 库 服 务 器 中 有 哪些 数据 库 。 查 看 数据 库 的 命令 
是 show databases;， 如 图 17-13 所 示 ， 注 意 该 命令 后 面 是 以 分 号 结尾 的 。 

创建 数据 库 可 以 使 用 create database testdb; 命令 ， 如 图 17-14 所 示 ，testdb 是 自 定义 数据 
库 名 ， 注 意 该 命令 后 面 是 以 分 号 结尾 的 。 
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图 17-13 ”查看 数据 库 信 息 


yl -hiocalhost -uroot -p123456 


图 17-14 ”创建 数据 库 


想 要 删除 数据 库 可 以 使 用 database testdb; 命令 ， 如 图 17-15 所 示 ，testdb 是 自 定义 数据 库 
名 ， 注 意 该 命令 后 面 是 以 分 号 结尾 的 。 


一 六 9 扩 二 罕 - mysql -Mocalhost -uroot -p123456 


图 17-15 ”删除 数据 库 
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4. 数据 表 管理 

在 使 用 数据 库 的 过 程 中 ， 有 时 需要 知道 某 个 数据 库 下 有 多 少 个 数据 表 ， 并 需要 查看 表 结构 
等 信息 。 

查看 有 多 少 个 数据 表 的 命令 是 show tables;， 如 图 17-16 所 示 ， 注 意 该 命令 后 面 是 以 分 
号 结尾 的 。 一 个 服务 器 中 有 很 多 数据 库 ， 应 该 先 使 用 use 选择 数据 库 。 如 图 17-16 所 示 ，use 
world 命令 结尾 没有 分 号 。 如 果 没 有 选择 数据 库 ， 会 发 生 错 误 ， 如 图 17-16 所 示 。 


一 二 于 全 3 控 示 行 -mysql -hlocalhost -uroot -p123456 


图 17-16 查看 数据 库 中 表 信息 


知道 了 有 哪些 表 后 ， 还 需要 知道 表 结构 ， 可 以 使 用 desc 命令 ， 如 获得 city 表 结 构 可 以 使 
用 desc city; 命令 ， 如 图 17-17 所 示 ， 注 意 该 命令 后 面 是 以 分 号 结尾 的 。 


~ EF- Mysql -Hocalhost -uroot -p123455 


图 17-17 查看 表 结构 


17.3 Python DB-API 


在 有 Python DB-API 规范 之 前 ， 各 个 数据 库 编程 接口 非常 混乱 ， 实 现 方式 差别 很 大 ， 更 换 
数据 库 工 作 量 非常 大 。Python DB-API 规范 要 求 各 个 数据 库 厂商 和 第 三 方 开发 商 ， 遵 循 统一 的 
编程 接口 ， 这 使 得 Python 开发 数据 库 变 得 统一 而 简单 ， 更 新 数据 库 工作 量 很 小 。 

Python DB-API 只 是 一 个 规范 ， 没 有 访问 数据 库 的 具体 实现 ， 规 范 是 用 来 约束 数据 库 厂商 
的 ， 要 求 数据 库 厂商 为 开发 人 员 提 供 访 问 数据 库 的 标准 接口 。 
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Python DB-API 规 范 涉 及 三 种 不 同 的 角色 : Python 官方 、 开 发 人 员 和 数据 库 厂商 ， 如 
图 17-18 所 示 。 


Python DB-API 规 范 


数据 库 厂商 提 数据 库 厂商 
en 加 [= | 
MySQL DB2 


图 17-18 Python DB-API 规范 的 三 种 不 同 角色 


。 Python 官方 制定 了 Python DB-API 规范 ， 这 个 规范 包括 全 局 变量 、 连 接 、 游 标 、 数 据 类 
型 和 异常 等 内 容 。 目 前 最 新 的 是 Python DB-API2 规范 。 

“数据 库 厂 商 为 了 支持 Python 语言 访问 自己 的 数据 库 ， 根 据 这 些 Python DB-API 规 范 提 
供 了 具体 的 实现 类 ， 如 连接 和 游标 对 象 具 体 实现 方式 。 当 然 针 对 某 种 数据 库 也 可 能 有 其 
他 第 三 方 具体 实现 。 

。 对 于 开发 人 员 而 言 ，Python DB-API 规范 提供 了 一 致 的 API 接口 ， 开 发 人 员 不 用 关心 实 
现 接口 的 细节 。 


17.3.1 建立 数据 连接 


数据 库 访 问 的 第 一 步 是 进行 数据 库 连接 。 建 立 数据 库 连 接 可 以 通过 connect(parameters…) 
函数 实现 ， 该 函数 根据 parameters 参数 连接 数据 库 ， 连 接 成 功 返 回 Connection 对 象 。 
连接 数据 库 的 关键 是 连接 参数 parameters， 使 用 pymysql 库 ? 连 接 数 据 库 示 例 代码 如 下 : 


import pymysql 


connection = pymysql.connect (host='localhost', 
user='root', 
password='12345°', 
database='mydb', 
charset="'utf8') 


pymysql.connectO 函数 中 常用 的 连接 参数 有 以 下 几 种 。 
。host: 数据 库 主 机 名 或 耳 地 址 。 

。port: 连接 数据 库 端口 号 。 

，user: 访问 数据 库 账 号 。 

。password 或 passwd: 访问 数据 库 密 码 。 

。database 或 db: 数据 库 中 的 库 名 。 

。charset: 数据 库 编 码 格式 。 


@ pymysql 是 访问 MySQL 数据 库 常用 的 开发 模块 ， 它 由 第 三 方 开发 商 提供 ， 不 是 MySQL 官方 提供 的 。 


226 硬 | Python 从 小 白 到 大 牛 


此 外 ， 还 有 很 多 参数 ， 如 有 需要 ， 读 者 可 以 参考 http://pymysql.readthedocs.io/en/latest/ 


modules/connections.html。 
注意 : 连接 参数 虽然 主要 包括 数据 库 主 机 名 或 JP 地 址 、 用 户 名 、 密 码 等 内 容 ， 但 是 不 


同 数 据 库 厂商 (或 第 三 方 开发 商 ) 提供 的 开发 模块 会 有 所 不 同 ， 具 体 使 用 时 需要 查询 开发 
文档 。 


Connection 对 象 有 一 些 重要 的 方法 ， 这 些 方法 如 下 。 

，close(): 关闭 数据 库 连 接 ， 关 闭 之 后 再 使 用 数据 库 连 接 将 引发 异常 。 
。commit(): 提交 数据 库 事物 。 

。rollback(): 回 滚 数据 库 事物 。 

。cursor(): 获得 Cursor 游标 对 象 。 


提示 : 数据 库 事务 通常 包含 了 多 个 对 数据 库 的 读 / 写 操作 ， 这 些 操作 是 有 序 的 。 若 事务 被 
提交 给 了 数据 库 管 理 系统 ， 则 数据 库 管 理 系统 需要 确保 该 事务 中 的 所 有 操作 都 成 功 完成 ， 结 果 
被 永久 保存 在 数据 库 中 。 如 果 事 务 中 有 的 操作 没有 成 功 完成 ， 则 事务 中 的 所 有 操作 都 需要 被 回 
滚 ， 回 到 事务 执行 前 的 状态 。 同 时 ， 该 事务 对 数据 库 或 者 其 他 事务 的 执行 无 影响 ， 所 有 的 事务 
都 看 似 在 独立 地 运行 。 


17.3.2 ”创建 游标 


一 个 Cursor 游标 对 象 表示 一 个 数据 库 游 标 ， 游 标 暂 时 保存 了 SQL 操作 所 影响 到 的 数据 。 
在 数据 库 事务 管理 中 游标 非常 重要 ， 游 标 是 通过 数据 库 连 接 创建 的 ， 相 同 数据 库 连接 创建 的 游 
标 所 引起 的 数据 变化 ， 会 马上 反映 到 同一 连接 中 的 其 他 游标 对 象 。 但 是 不 同 数据 库 连接 中 的 游 
标 ， 是 否 能 及 时 反映 出 来 ， 则 与 数据 库 事务 管理 有 关 。 

游标 Cursor 对 象 有 很 多 方法 和 属性 ， 其 中 基本 SQL 操作 方法 有 以 下 几 种 。 

1) execute(operation[, parameters]) 

执行 一 条 SQL 语句 ，operation 是 SQL 语句 ，parameters 是 为 SQL 提供 的 参数 ， 可 以 是 序 
列 或 字典 类 型 。 返 回 值 是 整数 ， 表 示 执 行 SQL 语句 影响 的 行 数 。 

2) executemany(operation[, seq_of params]) 

执行 批量 SQL 语句 ，operation 是 SQL 语句 ，seq_of params 是 为 SQL 提供 的 参数 ，seq_ 
of params 是 序列 。 返 回 值 是 整数 ， 表 示 执 行 SQL 语句 影响 的 行 数 。 

3) callproc(procname[, parameters]) 

执行 存储 过 程 ，procname 是 存储 过 程 名 ，parameters 是 为 存储 过 程 提供 的 参数 。 

执行 SQL 查询 语句 也 是 通过 execute() 和 executemany() 方法 实现 的 ， 但 是 这 两 个 方法 返 
回 的 都 是 整数 ， 对 于 查询 没有 意义 。 因 此 使 用 execute() 和 executemany0 方法 执行 查询 后 ， 还 
要 通过 提取 方法 提取 结果 集 ， 相 关 提 取 方 法 如 下 : 

。fetchone(): 从 结果 集中 返回 一 条 记录 的 序列 ， 如 果 没 有 数据 返回 None; 

。fetchmany([size=cursor.arraysize]) : 从 结果 和 集 返回 小 于 或 等 于 size 的 记录 数 序列 ， 如 果 

没有 数据 返回 空 序列 ，size 默认 情况 下 是 整个 游标 的 行 数 ; 
。fetchall0: 从 结果 集 返 回 所 有 数据 。 
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17.4 案例 : MySQL 数据 库 CRUD 操作 


对 数据 库 表 中 数据 可 以 进行 4 类 操作 : 数据 插入 〈Create)、 数 据 删 除 (Delete)、 数 据 更 新 
(Update) 和 数据 查询 (Read)， 也 就 是 俗称 的 “ 增 、 删 、 改 、 查 ”。 
本 节 通 过 一 个 案例 介绍 如 何 通 过 JDBC 技术 实现 Python 对 数据 的 CRUD 操作 。 ee 


17.4.1 安装 PyMySQL 模块 
PyMySQL 遵从 Python DB-API2 规范 ， 其 中 包含 了 纯 Python 实现 的 MySQL 客户 端 库 。 
PyMySQL 兼容 MySQLdb，MySQLdb 是 Python 2 中 使 用 的 数据 库 开发 模块 。Python 3 中 推荐 


使 用 PyMySQL 模块 。 本 节 首 先 介绍 如 何 安装 PyMySQL 模块 。 
通过 pip 安装 PyMySQL， 打 开 命 令 提 示 (Linux、UNIX 和 macOS 终端 )， 输 入 指令 如 下 : 


pip install PYMYSQL 


在 Windows 平台 下 执行 pip 安装 指令 过 程 如 图 17-19 所 示 ， 最 后 会 有 安装 成 功 提示 ， 其 他 平台 
安装 过 程 也 是 类 似 的 ， 这 里 不 再 装 述 。 


CWINDOWS\system32 


图 17-19 执行 pip 安装 指令 过 程 


提示 : 如 果 使 用 的 是 Python 2.7.9 及 以 上 和 Python 3.4 及 以 上 版 本 ,默认 安装 pip 工具 。 
如 果 没 有 pip 工具 可 以 重新 安装 。 图 17-20 是 在 Windows 平台 下 自 定义 安装 pip， 注 意 选中 
pip 复 选 框 。 另 外 可 以 在 https://pypi.python.org/pypi/pip 寻求 帮助 


3 (64-bit) Setup 


Optional Features 
加 Doa mn 


puthon 
for 


windows Back Nex || Cancel 


图 17-20 Windows 平台 下 自 定义 安装 pip 
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17.4.2 数据库 编 程 的 一 般 过 程 


在 讲解 案例 之 前 ， 有 必要 先 介绍 一 下 通过 JDBC 进行 数据 库 编程 的 一 般 过 程 。 

如 图 17-21 所 示 是 数据 库 编 程 的 一 般 过 程 ， 其 中 查询 (Read) 过 程 和 修改 〈(C 插 入、U 更 
新 、D 删除 ) 过 程 都 是 最 多 需要 6 个 步骤 。 查 询 过 程 中 需要 提取 数据 结果 集 ， 这 是 修改 过 程 中 
没有 的 步骤 。 而 修改 过 程 中 如 果 成 功 执行 SQL 操作 则 提交 数据 库 事物 ， 如 果 失 败 则 回 滚 事 物 。 
最 后 不 要 忘记 释放 资源 ， 即 关闭 游标 和 数据 库 。 


2. 创建 游标 对 象 


执行 查询 执行 插入 、 制 除 和 更 新 


3. 执行 SQL 操作 


二 
4. 提取 结果 集 4. 回 滚 数据 库 事务 4. 提交 数据 库 事务 
6. 关闭 数据 连接 


图 17-21 数据 库 编 程 的 一 般 过 程 


17.4.3 数据 查询 操作 


为 了 介绍 数据 查询 操作 案例 ， 这 里 准备 了 一 个 User 表 ， 它 有 字段 name 和 userid 两 个 ， 如 
表 17-1 所 示 。 


表 17-1 User 表 结 构 


字段 名 是 否 可 以 为 Nell 主键 
name varchar(20) 是 否 
userid int 否 是 


编写 数据 库 脚本 mydb-mysql-schema-gbk.sql 文件 内 容 如 下 。 
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/* chapter17/mydb-mysql-schema-gbk.sql */ 


/* 创建 数据 库 */ 
CREATE DATABASE IF NOT EXISTS MyDB; 


use MyDB; 
/* 用 户 表 */ 

CREATE TABLE IF NOT EXISTS user ( 

name varchar (20), /* 用 户 Id */ 
userid int, /* 用 户 密码 */ 


PRIMARY KEY (userid)); 


/* 插入 初始 数据 */ 
INSERT INTO user VALUES('Tom',1); 
INSERT INTO user VALUES('Ben',2); 


下 面 介绍 如 何 实现 如 下 两 条 SQL 语句 的 查询 功能 。 


select name,userid from user where userid > ? order by userid // 有 条 件 查询 


select max (userid) from user // 使 用 max 等 函数 ， 无 条 件 查 询 


1) 有 条 件 查询 实现 代码 


# coding=utf-8 
# 代码 文件 :chapterl7/ch17.4.3-1.py 


import pymysql 


# 1。 建立 数据 库 连接 

connection = pymysql.connect (host='localhost', 
user='root', 

12345', 


password: 


database='MyDB', 
charset='utf8') O 
try: 
# 2。 创建 游标 对 象 
with connection.cursor() as cursor: @ 
# 3。 执行 SQL 操作 
# sql = 'select name, userid from user where userid >%s' 四 
# cursor.execute(sql, [0]) @ # cursor.execute(sql, 0) 
sql = 'select name, userid from user where userid >%(id)s' © 
cursor.execute(sql, {'id': 0}) 
# 4。 提取 结果 集 
result_set = cursor.fetchall() 
for row in result set: 
print('id: {0} - name: {1}'.format (row[1], row[0])) 
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# with 代码 块 结束 5. 关闭 游标 


finally: 
# 6。 关闭 数据 连接 


connection.close() @ 


上 述 代码 第 @ 行 是 创建 数据 库 连接 ， 指 定编 码 格式 为 UTF-8，MYySQL 数据 库 默认 安装 以 
及 默认 创建 的 数据 库 都 是 UTF-8 编码 。 代 码 第 @ 行 是 关闭 数据 库 连接 。 

代码 第 @ 行 connection.cursor( 是 创建 游标 对 象 ， 并 且 使 用 了 with 代码 块 自动 管理 游标 对 
象 ， 因 此 虽然 在 整个 程序 代码 中 没有 关闭 游标 的 close0 语句 ， 但 是 with 代码 块 结束 时 就 会 关 
闭 游 标 对 象 。 

提示 : 为 什么 数据 库 连 接 不 使 用 类 似 于 游标 的 with 代码 块 管理 资源 呢 ? 数据 库 连接 如 
果 出 现 异 常 ， 程 序 再 往 后 执行 数据 库 操 作 已 经 没有 意义 了 ， 因 此 数据 库 连 接 不 需要 放 到 try- 
except 语句 中 ， 也 不 需要 with 代码 块 管理 。 


代码 第 回 行 是 要 执行 的 SQL 语句 ， 其 中 %(id)s 是 命名 占 位 符 。 代 码 第 @ 行 执行 SQL 语 
句 ， 并 绑 定 参数 ， 绑 定 参数 是 字典 类 型 , id 是 占 位 符 中 的 名 字 ， 是 字典 中 的 键 。 另 一 种 写法 是 ， 
占 位 符 是 %s， 见 代码 第 @ 行 ， 绑 定 参 数 是 序列 类 型 ， 见 代码 第 @ 行 。 另 外 ， 参 数 只 有 一 个 时 ， 
可 以 直接 绑 定 ， 所 以 第 @ 行 代码 可 以 替换 为 cursor.execute(sql, 0)。 

代码 第 @ 行 是 cursor.fetchall() 方法 提取 所 有 结果 集 。 代 码 第 @ 行 遍历 结果 集 。 代 码 第 @ 行 
是 取出 字段 内 容 ，row[0] 取 第 一 个 字段 内 容 ，row[1] 取 第 二 个 字段 内 容 。 


提示 : 提交 字段 时 ， 字 段 的 顺序 是 select 语句 中 列 出 的 字段 顺序 ， 不 是 数据 表 中 字段 的 顺 
除非 使 用 select * 语句 。 


2) 无 条 件 查询 实现 代码 


# coding=utf-8 
# 代码 文件 : chapter1l7/ch17.4.3-2.py 


序 


import pymysql 


# 1。 建立 数据 库 连 接 

connection = pymysql.connect (host='localhost', 
user='root', 
password="'12345"', 
database='MyDB', 
charset="'utf8') 


try: 
# 2。 创建 游标 对 象 


with connection.cursor() as cursor: 


# 3。 执行 SQL 操作 
sql = 'select max(userid) from user' 


cursor.execute (sq1) 


# 4. 提取 结果 集 
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row = cursor.fetchone() 


if row is not None: 
print ( 最 大 用 户 Id: {0}'.format (row[0])) 


@e 


# with 代码 块 结束 5. 关闭 游标 


finally: 
# 6。 关闭 数据 连接 


connection.close() 


上 述 代码 第 @ 行 使 用 cursor.fetchone() 方法 提取 一 条 数据 。 代 码 第 @ 行 判断 非 空 时 ， 提 取 
字段 内 容 ， 代 码 第 @ 行 是 取出 第 一 个 字段 内 容 。 


17.4.4 数据 修改 操作 


数据 修改 操作 包括 数据 插入 、 数 据 更 新 和 数据 删除 。 
1. 数据 插入 
数据 插入 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapterl7/ch17.4.4-1.py 


import pymysql 


# 查询 最 大 用 户 Id 
def read max userid(): 


< 省略 查询 最 大 用 户 Id 代码 > 


# 1。 建立 数据 库 连接 

connection = pymysql.connect (host='localhost', 
user='root', 
password="'12345"', 
database='MyDB', 
charset="'utf8') 


# 查询 最 大 值 


maxid = read max userid() 


try: 
# 2。 创建 游标 对 象 


with connection.cursor() as cursor: 


# 3。 执行 SQL 操作 

sql = "insert into user (userid, name) values (ssv,gss) " [oO) 
nextid = maxid + 1 

name = 'Tony' + str(nextid) 


cursor.execute(sql, (nextid, name)) 四 
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print (' 影响 的 数据 行 数 ，{01' . format (affectedcount) ) 


# 4。 提交 数据 库 事务 


connection .commit () @ 


# with 代码 块 结束 5. 关闭 游标 


except pymysql.DatabaseError: 图 
# 4。 回 滚 数据 库 事务 
connection.rollback() © 
finally: 
# 6。 关闭 数据 连接 
connection.close() 


代码 第 @ 行 插入 SQL 语句 ， 其 中 有 两 个 占 位 符 。 代 码 第 @ 行 是 绑 定 两 个 参数 ， 参 数 放 在 
一 个 元 组 中 ， 也 可 以 放 在 列表 中 。 如 果 SQL 执行 成 功 ， 则 通过 代码 第 @ 行 提交 数据 库 事务 ， 
否则 通过 代码 第 @ 行 回 深 数 据 库 事务 。 代 码 第 @ 行 是 捕获 数据 库 异常 ，DatabaseError 是 数据 
库 相 关 异 常 。 

Python DB-API2 规范 中 的 异常 类 继承 层次 如 下 所 示 。 


StandardError 
+-— Warnin 
+-— Error 
+-- InterfaceError 
+-- DatabaseError 
+-— DataError 
+-- OperationalError 
+-— IntegrityError 
+-- InternalError 
+-— ProgrammingError 
+-- NotSupportedError 


StandardError 是 Python DB-API 基 类 ， 一 般 的 数据 库 开发 使 用 DatabaseError 异常 及 其 子 类 。 
2. 数据 更 新 
数据 更 新 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l7/ch17.4.4-2.py 


import pymysql 


# 1。 建立 数据 库 连接 

connection = pymysql.connect (host='localhost', 
user="'root', 
password='12345", 
database='MyDB', 
charset="'utf8') 


try: 
# 2。 创建 游标 对 象 
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with connection.cursor() as cursor: 
# 3。 执行 SQL 操作 
sql = "update user set name = $s where userid > %s' 


affectedcount = cursor.execute(sql, ('Tom', 2)) 


print (' 影响 的 数据 行 数 : {0}' .format (affectedcount)) 
# 4。 提交 数据 库 事务 


connection.commit () 


# with 代码 块 结束 5. 关闭 游标 


except pymysql.DatabaseError as e: 
# 4。 回 滚 数据 库 事务 


connection.rollback() 


Print(e) 
finally: 
# 6， 关 闭 数据 连接 


connection.close() 


3. 数据 删除 
数据 删除 代码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapter1l7/ch17.4.4-3.py 


import pymysql 


# 查询 最 大 用 户 Id 
def read max userid(): 


< 省 略 查 询 最 大 用 户 Id 代码 > 


# 1。 建立 数据 库 连接 

connection = pymysql.connect (host='localhost', 
user='root', 
password="'12345', 

MyDB', 

charset="'utf8') 


database 


# 查询 最 大 值 


maxid = read max userid() 


try: 
# 2。 创建 游标 对 象 


with connection.cursor() as cursor: 


# 3。 执行 SQL 操作 
sql = "delete from user Where userid = %s" 


affectedcount = cursor.execute(sql, (maxid)) 


print (' 影响 的 数据 行 数 : {0}' .format (affectedcount)) 
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# 4。 提交 数据 库 事务 


connection.commit () 
# with 代码 块 结束 5. 关闭 游标 


except pymysql.DatabaseError: 
# 4。 回 滚 数据 库 事务 
connection.rollback () 
finally: 
# 6。 关 闭 数据 连接 


connection.close() 


数据 更 新 、 数 据 删 除 与 数据 插入 在 程序 结构 上 非常 类 似 ， 差 别 主要 在 于 SQL 语句 和 绑 定 
参数 的 不 同 。 具 体 代码 不 再 解释 。 


17.5 ”NoSQL 数据 存储 


目前 大 部 分 数据 库 都 是 关系 型 的 ， 通 过 SQL 语句 操作 数据 库 。 但 也 有 一 些 数据 库 是 非 
关系 型 的 ， 不 通过 SQL 语句 操作 数据 库 ， 这 些 数据 库 称 为 NoSQL 数据 库 。dbm (DataBase 
“” Manager) 数据 库 是 最 简单 的 NoSQL 数据 库 ， 它 不 需要 安装 ， 直 接 通过 键 值 对 数据 存储 。 
Python 内 置 dbm 模块 提供 了 存储 dbm 数据 的 API， 下 面 将 分 别 介绍 这 些 API。 


17.5.1 dbm 数据 库 的 打开 和 关闭 


与 关系 型 数据 库 类 似 ，dbm 数据 库 使 用 前 需要 打开 ， 使 用 完成 需要 关闭 。 打 开 数 据 库 使 用 
open() 函数 ， 它 的 语法 如 下 : 


dbm.open (file, flag="'r') 


参数 file 是 数据 库 文件 名 ， 包 括 路 径 ， 参 数 flag 是 文件 打开 方式 ，flag 取 值 说 明 如 下 。 

“7YT: 以 只 读 方式 打开 现 有 数据 库 ， 这 是 默认 值 。 

"，'w': 以 读 写 方式 打开 现 有 数据 库 。 

*'c': 以 读 写 方式 打开 数据 库 ， 如 果 数 据 库 不 存在 则 创建 。 

，n': 始终 创建 一 个 新 的 空 数据 库 ， 打 开 方 式 为 读 写 。 

关闭 数据 库 使 用 close( 函数 ，close() 函数 没有 参数 ， 使 用 起 来 比较 简单 。 但 笔者 更 推荐 
使 用 with as 语句 块 管理 数据 资源 释放 。 示 例 代 码 如 下 : 


with dbm.open (DB_NAME, 'c') as db: 


pass 
使 用 with as 语句 块 后 不 再 需要 自己 关闭 数据 库 。 


17.5.2 ”dbm 数据 存储 


dbm 数据 存储 方式 类 似 于 字典 数据 结构 ， 通 过 键 写 入 或 读 取 数 据 。 但 需要 注意 的 是 dbm 
数据 库 保 存 的 数据 是 字符 串 类 型 或 者 是 字 节 序列 (bytes) 类 型 。 
dbm 数据 存储 相关 语句 如 下 。 
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1) 写 入 数据 
d[key] = data 
d 是 打开 的 数据 库 对 象 ，key 是 键 ，data 是 要 保存 的 数据 。 如 果 key 不 存在 则 创建 key-data 


数据 项 ， 如 果 key 已 经 存在 则 使 用 data 覆盖 旧 数 据 。 
2) 读 取 数据 


data = d[key] 或 data = d.get (key, defaultvalue) 
使 用 data = d[key] 语句 读 取 数据 时 ， 如 果 没 有 key 对 应 的 数据 则 会 抛 出 KeyError 异常 。 
为 了 防止 这 种 情况 的 发 生 可 以 使 用 data = d.get(key, defaultvalue) 语句 ， 如 果 没 有 key 对 应 的 数 


据 ， 返 回 默 认 值 defaultvalue。 
3) 删除 数据 


del dl[key] 


按照 key 删除 数据 ， 如 果 没 有 key 对 应 的 数据 则 会 抛 出 KeyError 异常 。 
4) 查找 数据 


Hag = key in d 


按照 key 在 数据 库 中 查找 数据 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter17/ch17.5.2.py 


import dbm 


with dbm.open('mydb', 'c') as db: 


db['name'] = 'tony’ # 更 新 数据 
print (db['name'] .decode()) # 取出 数据 @ 
age = int(db.get('age', b'18').decode()) # 取出 数据 @ 


print (age) 


if "age' in db: # 判断 是 否 存在 age 数据 
db['age'] = '20" # 或 者 b'20" 
del db['name'] # 删除 name 数据 


上 述 代码 第 @ 行 按照 name 键 取 出 数据 ，db['name'] 表达 式 取出 的 数据 是 字 节 序列 ， 如 果 
需要 的 是 字符 串 则 需要 使 用 decode0 方法 将 字 节 序列 转换 为 字符 串 。 代 码 第 @ 行 读 取 age 键 数 
据 ， 表 达 式 db.get(age', b'18') 中 默认 值 为 b'18'，b'18' 是 字 节 序列 。 


本 章 小 结 


本 章 首先 介绍 了 MySQL 数据 库 的 安装 、 配 置 和 日 常 的 管理 命令 。 然 后 重点 讲解 了 Python 
DB-API 规范， 读者 需要 熟悉 如 何 建立 数据 库 连接 、 创 建 游标 和 从 游标 中 提取 数据 。 最 后 介绍 
了 dbm NoSQL 数据 库 ， 读 者 需要 了 解 dbm 的 使 用 方法 。 


= 


现代 的 应 用 程序 都 离 不 开 网 络 ， 网 络 编程 是 非常 重要 的 技术 。Python 提供 了 两 个 不 同 层次 
的 网 络 编程 API : 基于 Socket 的 低层 次 网 络 编程 和 基于 URL 的 高 层次 网 络 编程 。Socket 采用 
TCP、UDP 等 协议 ， 这 些 协议 属于 低层 次 的 通信 协议 ，URL 采用 HTTP 和 HTTPS， 这 些 属于 
高 层次 的 通信 协议 。 


18.1 网 络 基 础 
网 络 编程 需要 程序 员 掌 握 一 些 基础 的 网 络 知识 ， 这 一 节 先 介绍 一 些 网 络 基础 知识 。 
18.1.1 网 络 结构 


网 络 结构 是 网 络 的 构建 方式 ， 目 前 流行 的 有 客户 端 服务 器 结构 网 络 和 对 等 结构 网 络 。 

1. 客户 端 服务 器 结构 网 络 

客户 端 服务 器 (Client Server，C/S) 结构 网 络 是 一 种 主 从 结构 网 络 。 如 图 18-1 所 示 ， 服 务 
器 一 般 处 于 等 待 状态 ， 如 果 有 客户 端 请 求 ， 服 务 器 响应 请 求 ， 建 立 连 接 提 供 服 务 。 服 务 器 是 被 
动 的 ， 有 点 像 在 餐厅 吃饭 时 候 的 服务 员 ， 而 客户 端 是 主动 的 ， 像 在 餐厅 吃饭 的 顾客 。 


网 络 编 程 


图 18-1 客户 端 服务 器 结构 网 络 


事实 上 ， 生 活 中 很 多 网 络 服务 都 采用 这 种 结构 ， 如 Web 服务 、 文 件 传输 服务 和 邮件 服务 
等 。 虽 然 它们 存在 的 目的 不 一 样 ， 但 基本 结构 是 一 样 的 。 这 种 网 络 结构 与 设备 类 型 无 关 ， 服 务 
器 不 一 定 是 电脑 ， 也 可 能 是 手机 等 移动 设备 。 
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2. 对 等 结构 网 络 
对 等 结构 网 络 也 叫 点 对 点 网 络 (Peer to Peer，P2P)， 每 个 节点 之 间 是 对 等 的 。 如 图 18-2 
所 示 ， 每 个 节点 既是 服务 器 又 是 客户 端 ， 这 种 结构 有 点 像 吃 自助 餐 。 


a > gn > 


图 18-2 ”对 等 结构 网 络 


对 等 结构 网 络 分 布 范围 比较 小 ， 通 常 在 一 间 办 公 室 或 一 个 家 庭 内 ， 因 此 它 非常 适合 移动 设 
备 间 的 网 络 通信 ， 网 络 链 路 层 由 蓝牙 和 WiFi 实现 。 


18.1.2 TCP/IP 协议 


网 络 通信 会 用 到 协议 ， 其 中 TCP/IP 协议 是 非常 重要 的 。TCP/IP 协议 是 由 IP 和 TCP 两 个 
协议 构成 的 。IP (Internet ProtocoD 协议 是 一 种 低级 的 路 由 协议 ， 它 将 数据 拆 分 在 许多 小 的 数 
据 包 中 ， 并 通过 网 络 将 它们 发 送 到 某 一 特定 地 址 ， 但 无 法 保证 所 有 包 都 抵达 目的 地 ， 也 不 能 保 
证 包 的 顺序 。 由 于 IP 协议 传输 数据 的 不 安全 性 ， 网 络 通信 时 还 需要 TCP 协议 。 传 输 控制 协议 
(Transmission Control Protocol，TCP) 是 一 种 高 层次 的 协议 ， 面 向 连接 的 可 靠 数 据 传 输 协议 ， 
如 果 有 些 数据 包 没 有 收 到 会 重 发 ， 并 对 数据 包 内 容 的 准确 性 进行 检查 并 保证 数据 包 顺 序 ， 所 以 
该 协议 保证 数据 包 能 够 安全 地 按照 发 送 时 顺序 送 达 目的 地 。 


18.1.3 了 JP 地址 


为 实现 网 络 中 不 同 计算 机 之 间 的 通信 ， 每 台 计 算 机 都 必须 有 一 个 与 众 不 同 的 标识 ， 这 就 是 
IP 地 址 ，TCP/IP 使 用 IP 地 址 来 标识 源 地 址 和 目的 地 址 。 最 初 所 有 的 IP 地 址 都 是 32 位 的 数字 ， 
由 4 个 8 位 的 二 进 制 数 组 成 ， 每 8 位 之 间 用 圆 点 隔 开 ， 如 192.168.1.1， 这 种 类 型 的 地 址 通过 
IPv4 指定 。 而 现在 有 一 种 新 的 地 址 模式 称 为 IPv6，IPv6 使 用 128 位 数字 表示 一 个 地 址 ， 分 为 
8 个 16 位 块 。 尽 管 IPv6 比 IPv4 有 很 多 优势 ， 但 是 由 于 习惯 的 问题 ， 很 多 设备 还 是 采用 IPv4。 
不 过 Python 语言 同时 支持 IPv4 和 IPv6。 

在 IPv4 地 址 模式 中 IP 地 址 分 为 A、B、C、D 和 E5 类 。 

。A 类 地 址 用 于 大 型 网 络 ， 地 址 范围 : 1.0.0.1~126.155.255.254。 

。B 类 地 址 用 于 中 型 网 络 ， 地 址 范围 : 128.0.0.1~191.255.255.254。 

。C 类 地 址 用 于 小 规模 网 络 ， 地 址 范围 : 192.0.0.1~223.255.255.254。 

“DD 类 地 址 用 于 多 目的 地 信息 的 传输 和 备用 。 

“了 E 类 地 址 保留 仅 作 实验 和 开发 用 。 

另外 ， 有 时 还 会 用 到 一 个 特殊 的 了 P 地 址 127.0.0.1， 称 为 回 送 地 址 ， 指 本 机 。127.0.0.1 主 


对 等 点 


238 二 | Python 从 小 白 到 大 牛 


要 用 于 网 络 软件 测试 以 及 本 地 机 进程 间 通 信 ， 使 用 回 送 地 址 发 送 数据 ， 不 进行 任何 网 络 传输 ， 
只 在 本 机 进程 间 通信 。 


18.1.4 ”端口 


一 个 IP 地 址 标识 一 台 计 算 机 ， 每 一 台 计 算 机 又 有 很 多 网 络 通信 程序 在 运行 ， 提 供 网 络 服 
务 或 进行 通信 ， 这 就 需要 不 同 的 端口 进行 通信 。 如 果 把 IP 地 址 比 作 电话 号 码 ， 那 么 端口 就 是 
分 机 号 码 ， 进 行 网 络 通信 时 不 仅 要 指定 IP 地 址 ， 还 要 指定 端口 号 。 

TCP/IP 系统 中 的 端口 号 是 一 个 16 位 的 数字 ， 它 的 范围 是 0-65535。 小 于 1024 的 端口 号 
保留 给 预定 义 的 服务 ， 如 HTTP 是 80，FTP 是 21，Telnet 是 23，Email 是 25 等 ， 除 非 要 和 那 
些 服务 进行 通信 ， 否 则 不 应 该 使 用 小 于 1024 的 端口 。 


18.2 TCP Socket 低层 次 网 络 编程 


回 TCP/IP 协议 的 传输 层 有 两 种 传输 协议 : TCP (传输 控制 协议 ) 和 UDP (用 户 数 据 报 协 议 ) 。 
TCP 是 面向 连接 的 可 靠 数据 传输 协议 。TCP 就 好 比 电 话 ， 电 话 接 通 后 双方 才能 通话 ， 在 挂 断 电 
话 之 前 ， 电 话 一 直 占 线 。TCP 连接 一 旦 建立 起 来 ， 一 直 占 用 ， 直 到 关闭 连接 。 另 外 ，TCP 为 
了 保证 数据 的 正确 性 ， 会 重 发 一 切 没 有 收 到 的 数据 ， 还 会 对 数据 内 容 进行 验证 ， 并 保证 数据 传 
输 的 正确 顺序 。 因 此 TCP 协议 对 系统 资源 的 要 求 较 多 。 

基于 TCP Socket 编程 很 有 代表 性 ， 下 面 首先 介绍 TCP Socket 编程 。 


18.2.1 TCP Socket 通信 概述 


Socket 是 网 络 上 的 两 个 程序 ， 通 过 一 个 双向 的 通信 连接 ， 实 现 数 据 的 交换 。 这 个 双向 链 
路 的 一 端 称 为 一 个 Socket。Socket 通常 用 来 实现 客户 端 和 服务 端的 连接 。Socket 是 TCP/IP 协议 
的 一 个 十 分 流行 的 编程 接口 ， 一 个 Socket 由 一 个 卫 地 址 和 一 个 端口 号 唯一 确定 ， 一 旦 建立 连接 
Socket 还 会 包含 本 机 和 远程 主机 的 IP 地 址 和 远 端 口号 ， 如 图 18-3 所 示 ，Socket 是 成 对 出 现 的 。 


服务 器 端 程序 客户 端 程序 SD 
~ Socket Socket < 


本 机 : 192.168.1.7 : 8080 本 机 : 192.168.1.5 : 8081 
远程 主机 : 192.168. 8081 远程 主机 : 192.168.1.7 : 8080 


国 3 
扫 码 看 视频 


图 18-3 ”TCP Socket 通信 


18.2.2 ”TCP Socket 通信 过 程 


使 用 TCP Socket 进行 C/S 结构 编程 ， 通 信 过 程 如 图 18-4 所 示 。 

从 图 18-4 可 见 ， 服 务 器 首先 绑 定 本 机 的 IP 和 端口 ， 如 果 端 口 已 经 被 其 他 程序 占用 则 抛 出 
异常 。 如 果 绑 定 成 功 则 监听 该 端口 。 服 务 器 端 调用 socket.accept0 方法 阻塞 程序 ， 等 待 客户 端 
连接 请 求 。 当 客户 端 向 服务 器 发 出 连接 请 求 ， 服 务 器 接收 客户 端 请 求 建立 连接 。 一 旦 连接 建立 
起 来 ， 服 务 器 与 客户 端 就 可 以 通过 Socket 进行 双向 通信 了 ， 最 后 关闭 Socket 释放 资源 。 
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服务 器 客户 端 


指定 服务 器 |P 和 端口 


绑 定 IP 和 端口 


监听 端口 


等 待 客户 端 连接 请 求 向 服务 器 发 出 连接 请 求 


应 答 客户 端 @ 


接收 请 求 ， 连 接 建立 


向 客户 端 发 闫 数据 或 有 asiaal 。 从 服务 接收 数据 或 
从 客户 器 接 收 数 据 向 服务 器 发 送 数据 


关闭 Socket 释 放 资源 关闭 Socket 释 放 资 源 


图 18-4 TCP Socket 通信 过 程 


18.2.3 TCP Socket 编程 API 


Python 提供 了 两 个 socket 模块 : socket 和 socketserver。socket 模块 提供 了 标准 的 BSD 
Socket@ API ; socketserver 重点 是 网 络 服务 器 开发 ， 它 提供 了 4 个 基本 服务 器 类 ， 可 以 简化 服 
务 器 开发 。 本 书 重点 介绍 socket 模块 实现 的 Socket 编程 。 

1. 创建 TCP Socket 

socket 模块 提供 了 一 个 socket0 函数 可 以 创建 多 种 形式 的 socket 对 象 ， 本 节 重 点 介绍 创建 
TCP Socket 对 象 ， 创 建 代码 如 下 : 


3 = socket.socket (socket.AF_INET, socket.SOCK_ STREAM) 


参数 socket.AF_INET 设置 也 地址 类 型 是 IPv4， 如 果 采 用 IPv6 地 址 类 型 参数 是 socket. 
AF_INET6。 参 数 socket.SOCK_STREAM 设置 Socket 通信 类 型 是 TCP。 

2. TCP Socket 服务 器 编程 方法 

socket 对 象 有 很 多 方法 ， 其 中 与 TCP Socket 服务 器 编程 有 关 的 方法 如 下 : 

，socket.bind(address) : 绑 定 地 址 和 端口 ，address 是 包含 主机 名 (或 他 地址 ) 和 端口 的 二 
元 组 对 象 ; 

。socket.listen(backlog): 监听 端口 ，backlog 最 大 连接 数 ，backlog 默认 值 是 1; 

。 socket.accept(): 等 待 客户 端 连接 ， 连 接 成 功 返回 二 元 组 对 象 (conn, address)， 其 中 conn 
是 新 的 socket 对 象 ， 可 以 用 来 接收 和 发 送 数据 ，address 是 客户 端的 地 址 。 


@@ BSD Socket， 也 叫 伯克利 套 接 字 (Berkeley Socket) ， 它 是 由 伯克利 加 州 大 学 (University of California. 
Berkeley) 的 学 生 开发 的 。BSD Socket 是 Unix 平台 下 广泛 使 用 的 Socket 编程 方法 。 
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3. 客户 端 编程 socket 方法 

socket 对 象 中 与 TCP Socket 客户 端 编程 有 关 的 方法 如 下 : 

。 socket.connect(address) : 连接 服务 器 socket，address 是 包含 主机 名 (或 IP 地址 ) 和 端 
口 的 二 元 组 对 象 。 

4. 服务 器 和 客户 端 编程 socket 共用 方法 

socket 对 象 中 有 一 些 方法 是 服务 器 和 客户 端 编程 共用 方法 ， 这 些 方 法 如 下 : 

。 socket.recv(buffsize) : 接收 TCP Socket 数据 ， 该 方法 返回 字 节 序列 对 象 。 参 数 buffsize 

指定 一 次 接收 的 最 大 字 节 数 ， 因 此 如 果 要 接收 的 数据 量 大 于 buffsize， 则 需要 多 次 调用 

该 方法 进行 接收 。 

socket.send(bytes) : 发 送 TCP Socket 数据 ， 将 bytes 数据 发 送 到 远程 Socket， 返 回 成 功 

发 送 的 字 节 数 。 如 果 要 发 送 的 数据 量 很 大 ， 需 要 多 次 调用 该 方法 发 送 数据 。 

socket.sendall(bytes) : 发 送 TCP Socket 数据 ， 将 bytes 数据 发 送 到 远程 Socket， 如 果 发 

送 成 功 返回 None， 如 果 失 败 则 抛 出 异常 。 与 socket.send(bytes) 不 同 的 是 ， 该 方法 连续 

发 送 数据 ， 直 到 发 送 完 所 有 数据 或 发 生 异 常 。 

socket.settimeout(timeout) : 设置 Socket 超时 时 间 ，timeout 是 一 个 浮 点 数 ， 单 位 是 秒 ， 

值 为 None 则 表示 永远 不 会 超时 。 一 般 超 时 时 间 应 在 刚 创 建 Socket 时 设置 。 

Socket.close() : 关闭 Socket， 该 方法 虽然 可 以 释放 资源 ， 但 不 一 定 立 即 关 闭 连 接 ， 如 果 

要 及 时 关闭 连接 ， 需 要 在 调用 该 方法 之 前 调用 shutdown() 方法 。 


注意 ; Python 中 的 socket 对 象 是 可 以 被 垃圾 回收 的 ， 当 socket 对象 被 垃圾 回收 ， 则 
socket 对 象 会 自动 关闭 ， 但 建议 显 式 地 调用 close() 方法 关闭 socket 对 象 。 


18.2.4 ”案例 : 简单 聊天 工具 

基于 TCP Socket 编程 比较 复杂 ， 先 从 一 个 简单 的 聊天 工具 案例 介绍 TCP Socket 编程 的 基 
本 流程 。 该 案例 实现 了 从 客户 端 发 送 字符 串 给 服务 器 ， 然 后 服务 器 再 返回 字符 串 给 客户 端 。 

案例 服务 器 端 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter18/18.2.4/tcp-server.py 


import socket 


3 = socket.socket (socket.AF_INET, socket.SOCK_ STREAM) 
3.bind(('', 8888)) 
s.listen() 


print (' 服务 器 启动 ...') 


@@e 


# 等 待 客户 端 连 接 
conn, address = s.accept() @ 
# 客户 端 连 接 成 功 


print (address) 


# 从 客户 端 接收 数据 
data = conn.recv(1024) © 
print ("从 客户 端 接收 消息 : {0}' .format (data.decode ())) 
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# 给 客户 端 发 送 数据 

conn.send(' 你 好 ' .encode()) 
# 释放 资源 

conn.close () 加 
s.close() 


上 述 代码 第 @ 行 是 创建 一 个 socket 对 象 。 代 码 第 @ 行 是 绑 定 本 机 IP 地 址 和 端口 ， 其 中 卫 
地 址 为 空 字符 串 ， 系 统 会 自动 为 其 分 配 可 用 的 本 机 IP 地 址 ，8888 是 绑 定 的 端口 。 代 码 第 @ 行 
是 监听 本 机 8888 端口 。 

代码 第 @ 行 使 用 accept0 方法 阻塞 程序 ， 等 待 客户 端 连接 ， 返 回 二 元 组 ， 其 中 conn 是 一 
个 新 的 socket 对 象 ，address 是 当前 连接 的 客户 端 地 址 。 代 码 第 @ 行 使 用 recv() 方法 接收 数据 ， 
参数 1024 是 设置 一 次 接收 的 最 大 字 节 数 ， 返 回 值 是 字 节 序列 对 象 ， 字 节 序 列 转换 为 字符 串 ， 
可 以 通过 data.decode() 方法 实现 ，decode() 方法 中 可 以 指定 字符 集 ， 默 认 字 符 集 是 UTF-8。 代 
码 第 @ 行 使 用 send0 方法 发 送 数据 ， 参 数 是 字 节 序列 对 象 ， 如 果 发 送 字符 串 则 需要 转换 为 字 节 
序列 ， 使 用 字符 串 的 encode() 方法 进行 转换 ，encode() 方法 也 可 以 指定 字符 集 ， 默 认 字符 集 是 
UTF-8。' 你 好 '.encode() 是 将 字符 串 ' 你 好 ' 转换 为 字 节 序列 对 象 。 

代码 第 @ 行 是 关闭 conn 对 象 ， 代 码 第 @ 行 是 关闭 s 对 象 ， 它 们 都 是 socket 对 象 。 

案例 客户 端 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter18/18.2.4/tcp-client.py 


import socket 


3 = socket.socket (socket.AF_INET, socket.SOCK_ STREAM) 
# 连接 服务 器 
s.connect(('127.0.0.1', 8888)) 


# 给 服务 器 端 发 送 数据 

s.send(b'Hello') @ 
# 从 服务 器 端 接收 数据 

data = s.recv(1024) 


print(' 从 服务 器 端 接收 消息 : {0}'.format (data.decode())) 


# 释放 资源 


s.close() 


上 述 代码 第 @@ 行 是 创建 socket 对 象 。” 代 码 第 回 行 连接 远程 服务 器 socket， 其 参数 
(127.0.0.1, 8888) 是 二 元 组 ，'127.0.0.1' 是 远程 服务 器 IP 地 址 或 主机 名 ，8888 是 远程 服务 器 端 
口 。 代 码 第 @ 行 是 发 送 Hello 字符 串 ， 在 字符 串 前 面 加 字母 b 可 以 将 字符 串 转换 为 字 节 序列 ， 
b'Hello' 是 将 Hello 转换 为 字 节 序列 对 象 ， 但 是 这 种 方法 只 适合 ASCII 字符 串 ， 非 ASCII 字符 
串 会 引发 异常 。 

测试 运行 时 首先 运行 服务 器 ， 然 后 再 运行 客户 端 。 

服务 器 端 输出 结果 如 下 : 

服务 器 启动 . . . 


('127.0.0.1', 56802) 
从 客户 端 接收 消息 : Hello 
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客户 端 输出 结果 如 下 : 
从 服务 器 端 接收 消息 ， 你 好 


18.2.5 案例: 文件 上 传 工具 


18.2.4 节 案 例 功 能 非常 简单 ， 从 中 可 以 了 解 TCP Socket 编程 的 基本 流程 。 本 节 再 介绍 一 
个 案例 ， 该 案例 实现 了 文件 上 传 功能 ， 客 户 端 读 取 本 地 文件 ， 然 后 通过 Socket 通信 发 送 给 服 
务 器 ， 服 务 器 接收 数据 保存 到 本 地 。 

案例 服务 器 端 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter18/18.2.5/upload-server.py 


import socket 


HOST = "'" 
PORT = 8888 


f _ name = "coco2dxcplus_copy.jpg' 


with socket.socket (socket.AF INET, socket.SOCK STREAM) as 3s: [Oy 
3s.bind( (HOST, PORT)) 
s.listen(10) 
print (' 服务 器 启动 ...') 


while True: 
with s.accept() [0] as conn: 
# 创建 字 节 序列 对 象 列表 ， 作 为 接收 数据 的 缓冲 区 
buffer = [] 
while True: # 反复 接收 数据 
data = conn.recv (1024) 
if data: 
# 接收 的 数据 添加 到 缓冲 区 
buffer.append (data) 


QE@@© @e 


else: 
# 没有 接收 到 数据 则 退出 
break 
# 将 接收 的 字 节 序 列 对 象 列 表 合并 为 一 字 节 序列 对 象 
b = bytes() .join (buffer) 
with open(f name, 'wb') as f: 
f.write (b) 


四 四 


print (' 服务 器 接收 完成 。' ) 


上 述 代 码 第 @ 行 创建 了 socket 对 象 ， 注 意 这 里 使 用 with as 代码 块 自动 管理 socket 对 象 。 
代码 第 @ 行 是 一 个 while“ 死 循环 ”， 可 以 反复 接收 客户 端 请 求 ， 然 后 进行 处 理 。 代 码 第 @ 行 调 
用 accept0 方法 等 待 客户 端 连接 ， 这 里 也 使 用 with as 代码 块 自动 管理 socket 对 象 ， 但 是 需要 
注意 的 是 ，with as 不 能 管理 多 个 变量 ，accept() 方法 返回 元 组 是 多 个 变量 ， 而 s.accept0[0] 表 
达 式 只 是 取出 conn 变量 ， 它 是 一 个 socket 对 象 。 


第 18 章 ”网络 编程 | 其 243 


代码 第 @ 行 是 创建 一 个 空 列表 buffer， 由 于 一 次 从 客户 端 接收 的 数据 只 是 一 部 分 ， 需 要 将 
接收 的 字 节 数据 收集 到 buffer 中 。 代 码 第 @@ 行 是 一 个 while 循环 ， 用 来 反复 接收 客户 端的 数 
据 ， 当 客户 端 不 再 有 数据 上 传 时 退出 循环 。 代 码 第 @ 行 判断 客户 端 是 否 有 数据 上 传 ， 如 果 有 则 
追加 到 buffer 中 ， 否 则 退出 while 循环 。 代 码 第 @ 行 是 接收 客户 端 数据 ， 指 定 一 次 接收 的 数据 
最 大 是 1024 字 节 。 

代码 第 @ 行 是 将 buffer 中 的 字 节 连接 合并 为 一 字 节 序列 对 象 ，bytes() 是 创建 一 个 空 的 字 节 
序列 对 象 ， 字 节 序 列 对 象 join(buffer) 方法 可 以 将 buffer 连接 起 来 。 

代码 第 @@ 行 是 以 写 入 模式 打开 二 进 制 本 地 文件 ， 将 从 客户 端 上 传 的 数据 b 写 入 到 文件 中 ， 
从 而 实现 文件 上 传 服务 器 端 处 理 。 

案例 客户 端 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter18/18.2.5/upload-client .py 


import socket 


HOST = "127.0.0.1" 
PORT = 8888 
f _ name = "coco2dxcplus.jpg'" 


with socket.socket (socket.AF INET, socket.SOCK STREAM) as 3s: 
s.connect ( (HOST, PORT)) 


with open(f name, 'rb') as f: 
b = f.read() 
s.sendall (b) 
print (' 客户 端 上 传 数据 完成 。' ) 


上 述 代码 第 @ 行 是 创建 客户 端 socket 对 象 。 代 码 第 @ 行 连接 远程 服务 器 socket。 代 码 第 @ 
行 是 以 只 读 模式 打开 二 进 制 本 地 文件 。 代 码 第 @ 行 是 读 取 文件 到 字 节 对 象 b 中 ， 注 意 f.read() 
方法 会 读 取 全 部 的 文件 内 容 ， 也 就 是 说 b 是 文件 的 全 部 字 节 。 发 送 数 据 可 以 使 用 socket 对 象 的 
send() 方法 分 多 次 发 送 ， 也 可 以 使 用 socket 对 象 的 sendall0) 方法 一 次 性 发 送 ， 本 例 中 使 用 了 
sendall() 方法 ， 见 代码 第 @ 行 。 


@e@e © © 


18.3 UDP Socket 低层 次 网 络 编程 


UDP (用 户 数据 报 协议 ) 就 像 日 常生 活 中 的 邮件 投递 ， 是 不 能 保证 可 靠 地 寄 到 目的 地 的 。 
UDP 是 无 连接 的 ， 对 系统 资源 的 要 求 较 少 ，UDP 可 能 丢 包 ， 不 保证 数据 顺序 。 但 是 对 于 网 络 游 
戏 和 在 线 视频 等 要 求 传输 快 、 实 时 性 高 、 质 量 可 稍 差 一 点 的 数据 传输 ，UDP 还 是 非常 不 错 的 。 

UDP Socket 网 络 编程 比 TCP Socket 编程 简单 得 多 ，UDP 是 无 连接 协议 ， 不 需要 像 TCP 
一 样 监听 端口 ， 建 立 连 接 ， 然 后 才能 进行 通信 。 


18.3.1 UDP Socket 编程 API 
socket 模块 中 UDP Socket 编程 API 与 TCP Socket 编程 API 是 类 似 的 ， 都 是 使 用 socket 
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对 象 ， 只 是 有 些 参数 是 不 同 的 。 
1. 创建 UDP Socket 
创建 UDP Socket 对 象 也 是 使 用 socket() 函数 ， 创 建 代码 如 下 : 


3 = socket.socket (socket.AF INET, socket.SOCK DGRAM) 


与 创建 TCP Socket 对 象 不 同 ， 使 用 的 socket 类 型 是 socket.SOCK_DGRAM。 

2. UDP Socket 服务 器 编程 方法 

socket 对 象 中 与 UDP Socket 服务 器 编程 有 关 的 方法 是 bind0 方法 ， 注 意 不 需要 listen() 和 
accept()， 这 是 因为 UDP 通信 不 需要 像 TCP 一 样 监听 端口 ， 建 立 连接 。 

3. 服务 器 和 客户 端 编程 socket 共用 方法 

socket 对 象 中 有 一 些 方法 是 服务 器 和 客户 端 编程 的 共用 方法 ， 这 些 方法 如 下 。 
socket.recvfrom(buffsize) : 接收 UDP Socket 数 据 ， 该 方法 返回 二 元 组 对 象 (data, 
address)，data 是 接收 的 字 节 序列 对 象 ，address 发 送 数 据 的 远程 Socket 地 址 ， 参 数 
buffsize 指定 一 次 接收 的 最 大 字 节 数 ， 因 此 如 果 要 接收 的 数据 量 大 于 buffsize， 则 需要 多 
次 调用 该 方法 进行 接收 。 
socket.sendto(bytes, address) : 发 送 UDP Socket 数 据 ， 将 bytes 数据 发 送 到 地 址 为 
address 的 远程 Socket， 返 回 成 功 发 送 的 字 节 数 。 如 果 要 发 送 的 数据 量 很 大 ， 需 要 多 次 
调用 该 方法 发 送 数 据 。 
socket.settimeout(timeout): 同 TCP Socket。 
socket.close(): 关闭 Socket， 同 TCP Socket。 


18.3.2 ”案例 : 简单 聊天 工具 


与 TCP Socket 相 比 UDP Socket 编程 比较 简单 。 为 了 比较 ， 将 18.2.4 节 案 例 采 用 UDP 
Socket 重 构 。 
案例 服务 器 端 代码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapter18/18.3.2/udp-server.py 


import socket 


3 = socket.socket (socket.AF _INET, socket.SOCK DGRAM) 
3.bind(('', 8888)) 
print (' 服务 器 启动 . ..') 


@ 日 


# 从 客户 端 接收 数据 

data, client address = s.recvfrom(1024) @ 
print ('， 从 客户 端 接收 消息 : {0}' .format (data.decode ())) 

# 给 客户 端 发 送 数据 

s.sendto(' 你 好 ' .encode()，client_address) @ 


# 释放 资源 


s.close() 


上 述 代码 第 中行 是 创建 一 个 UDP socket 对 象 。 代 码 第 @ 行 是 绑 定 本 机 IP 地 址 和 端口 ， 其 
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中 IP 地 址 为 空 字符 串 ， 系 统 会 自动 为 其 分 配 可 用 的 本 机 IP 地 址 ，8888 是 绑 定 的 端口 。 
代码 第 图 行使 用 recvfrom0 方法 接收 数据 ， 参 数 1024 是 设置 的 一 次 接收 的 最 大 字 节 数 ， 
返回 值 是 字 节 序列 对 象 。 代 码 第 @ 行 使 用 sendto() 方法 是 发 送 数据 。 
案例 客户 端 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter18/18.3.2/udp-client.py 


import socket 


3 = socket.socket (socket.AF_ INET, socket.SOCK DGRAM) [0 
# 服务 器 地 址 
server_address = ('127.0.0.1', 8888) @ 


# 给 服务 器 端 发 送 数据 
3.sendto(b'Hello', server address) 
# 从 服务 器 端 接收 数据 

data, _ = s.recvfrom(1024) 


print (' 从 服务 器 端 接收 消息 ; {0}'.format (data.decode())) 


# 释放 资源 


s.close() 
上 述 代码 第 @ 行 是 创建 UDP socket 对 象 ， 代 码 第 @ 行 是 创建 服务 器 地 址 元 组 对 象 。 


18.3.3 ”案例 : 文件 上 传 工具 


为 了 对 比 TCP Socket， 本 节 介 绍 一 个 采用 UDP Socket 实现 的 文本 文件 上 传 工具 。 
案例 服务 器 端 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter18/18.3.3/upload-server.py 


import socket 


HOST = "127.0.0.1" 
PORT 8888 


1 


f name = 'test_ copy.txt" 


with socket.socket (socket.AF_INET, socket.SOCK DGRAM) as 3s: 
3s.bind( (HOST, PORT)) 
Print (' 服务 器 启动 . . . ') 


# 创建 字 节 序列 对 象 列 表 ， 作 为 接收 数据 的 缓冲 区 
buffer = [] 
while True: # 反复 接收 数据 


data, _ = s.recvfrom(1024) 
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if data: 
flag = data.decode() 


©o 


if flag == 'bye': 
break 
buffer.append (data) 
else: 
# 没有 接收 到 数据 ， 进 入 下 次 循环 继续 接收 
continue 
# 将 接收 的 字 节 序列 对 象 列 表 合 并 为 一 字 节 序列 对 象 
b = bytes().join(buffer) 
with open(f name, 'w') as f: 
f.write(b.decode ()) 


print (' 服务 器 接收 完成 。' ) 


与 TCP Socket 不 同 ，UDP Socket 无 法 知道 哪些 数据 包 已 经 是 最 后 一 个 了 ， 因 此 需要 发 送 
方 发 出 一 个 特殊 的 数据 包 ， 包 中 包含 一 些 特殊 标志 。 代 码 第 @ 行 解码 数据 包 ， 代 码 第 @ 行 判断 
这 个 标志 是 否 为 "bye' 字符 串 ， 如 果 是 ， 则 结束 接收 数据 。 

案例 客户 端 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter18/18.3.3/upload-client.py 


import socket 
HOST = "127.0.0.1" 


PORT = 8888 
f name = 'test.txt" 


# 服务 器 地 址 
server address = (HOST， PORT) 


with socket.socket (socket.AF_INET, socket.SOCK DGRAM) as 3: 


with open(f name, 'r') as f: 


while True: # 反复 从 文件 中 读 取 数 据 
data = f.read(1024) (0 
if data: 
# 发 送 数 据 
s.sendto(data.encode(), server address) © 
elses 
# 发 送 结束 标志 
s.sendto(b'bye', server address) @ 
# 文件 中 没有 可 读 取 的 数据 则 退出 
break 


print (' 客户 端 上 传 数据 完成 。' ) 


上 述 代码 第 @ 行 是 不 断 地 从 文件 读 取 数 据 ， 如 果 文件 中 有 可 读 取 的 数据 则 通过 代码 第 @ 行 
发 送 数据 到 服务 器 ， 如 果 没 有 数据 则 发 送 结束 标志 ， 见 代码 第 @@ 行 。 
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18.4 访问 互联 网 资源 

Python 的 urllib 库 提 供 了 高 层次 网 络 编程 API， 通 过 urllib 库 可 以 访问 互联 网 资源 。 使 用 
urllib 库 进 行 网 络 编程 ， 不 需要 对 协议 本 身 有 太 多 的 了 解 ， 相 对 而 言 是 比较 简单 的 。 

18.4.1 URL 概念 扫 码 看 视频 


互联 网 资源 是 通过 URL 指定 的 ，URL 是 Uniform Resource Locator 的 简称 ， 翻 译 过 来 是 
“统一 资源 定位 器 ”， 但 人 们 都 习惯 URL 简称 。 
URL 组 成 格式 如 下 : 


协议 名 : // 资源 名 


“协议 名 ”获取 资源 所 使 用 的 传输 协议 ， 如 http、ftp、gopher 和 file 等 ,“ 资 源 名 ” 则 是 资 
源 的 完整 地 址 ， 包 括 主机 名 、 端 口号 、 文 件 名 或 文件 内 部 的 一 个 引用 。 例 如 : 


http://www.sina.com/ 


http://home.sohu.com/home/welcome.html 
http://www.zhijieketang.com:8800/Gamelan/network.html#BOTTOM 


18.4.2 HTTP/HTTPS 协议 


互联 网 访问 大 多 都 基于 HTTP/HTTPS 协议 。 下 面 将 介绍 HTTP/HTTPS 协议 。 
1. HTTP 协议 
HTTP 是 Hypertext Transfer Protocol 的 缩写 ， 即 超 文本 传输 协议 。HTTP 属于 应 用 层 的 面 
向 对 象 的 协议 ， 其 简捷 、 快 速 的 方式 适用 于 分 布 式 超 文本 信息 的 传输 。 它 于 1990 年 提出 ,经 
过 多 年 的 使 用 与 发 展 ， 得 到 不 断 完善 和 扩展 。HTTP 协议 支持 C/S 网 络 结构 ， 是 无 连接 协议 ， 
即 每 一 次 请 求 时 建立 连接 ， 服 务 器 处 理 完 客户 端的 请 求 后 ， 应 答 给 客户 端 然 后 断 开 连接 ， 不 会 
一 直 占 用 网 络 资源 。 
HTTP/1.1 协议 共 定义 了 8 种 请 求 方法 : OPTIONS、HEAD、GET、POST、PUT、DELETE、 
TRACE 和 CONNECT。 在 HTTP 访问 中 ， 一 般 使 用 GET 和 HEAD 方法 。 
。GET 方法 : 向 指定 的 资源 发 出 请 求 ， 发 送 的 信息 “ 显 式 ” 地 跟 在 URL 后 面 。GET 方法 
只 用 在 读 取 数 据 ， 例 如 静态 图 片 等 。GET 方法 有 点 像 使 用 明信片 给 别人 写 信 ,“ 信 内 容 ” 
写 在 外 面 ， 接 触 到 的 人 都 可 以 看 到 ， 因 此 是 不 安全 的 。 
“POST 方法 : 向 指定 资源 提交 数据 ， 请 求 服务 器 进行 处 理 ， 例 如 提交 表单 或 者 上 传 文件 
等 。 数 据 被 包含 在 请 求 体 中 。POST 方法 像 是 把 “ 信 内 容 ” 装 入 信封 中 ， 接 触 到 的 人 都 
看 不 到 ， 因 此 是 安全 的 。 
2. HTTPS 协议 
HTTPS 是 Hypertext Transfer Protocol Secure 的 缩写 ， 即 超 文 本 传输 安全 协议 ， 是 超 文本 
传输 协议 和 SSL 的 组 合 ， 用 以 提供 加 密 通 信 及 对 网 络 服务 器 身份 的 鉴定 。 
简单 地 说 ，HTTPS 是 HITP 的 升级 版 ，HTTPS 与 HTTP 的 区 别 是 ，HTTPS 使 用 https:// 
代替 http://，HTTPS 使 用 端口 443， 而 HTTP 使 用 端口 80 来 与 TCP/IP 进行 通信 。SSL 使 用 
40 位 关键 字 作 为 RC4 流 加 密 算法 ， 这 对 于 商业 信息 的 加 密 是 合适 的 。HTTPS 和 SSL 支持 使 
用 X.509 数字 认证 ， 如 果 需 要 的 话 ， 用 户 可 以 确认 发 送 者 是 谁 。 
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18.4.3 使 用 urllib 库 


Python 的 urllib 库 其 中 包含 了 如 下 4 个 模块 。 

。 urllib.request 模块 : 用 于 打开 和 读 写 URL 资源 。 

。 urllib.error 模块 : 包含 了 由 urllib.request 引发 的 异常 。 

。urllib.parse 模块 : 用 于 解析 URL 。 

。urllib.robotparser 模块 : 分 析 robots.txt 文件 了。 

在 访问 互联 网 资源 时 主要 使 用 的 模块 是 urllib.request、urllib.parse 和 urllib.error， 其 中 最 
核心 的 是 urllib.request 模块 ， 本 章 重 点 介绍 urllib.request 模块 的 使 用 。 

在 urllib.request 模块 中 访问 互联 网 资源 主要 使 用 urllib.request.urlopen0 函数 和 urllib 
.Tequest.Request 对 象 ，urllib.request.urlopen( 函数 可 以 用 于 简单 的 网 络 资源 访问 ， 而 urllib 
-Tequest.Request 对 象 可 以 访问 复杂 网 络 资源 。 

使 用 urllib.request.urlopen() 函数 最 简单 形式 的 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l8/ch18.4.3.py 


import urllib.request 


with urllib.request.urlopen('http://www.sina.com.cn/') as response: 
data = response.read() 
html = data.decode() 
print (html) 
上 述 代 码 第 @@ 行 使 用 urlopen() 函数 打开 http://www.sina.com.cn 网 站 ，urlopen() 函数 返回 
一 个 应 答对 象 ， 应 答对 象 是 一 种 类 似 文件 对 象 〈file-like objecD， 该 对 象 可 以 像 使 用 文件 一 样 
使 用 ， 可 以 使 用 with as 代码 块 自动 管理 资源 释放 。 代 码 第 @ 行 是 read() 方法 读 取 数据 ， 但 是 
该 数据 是 字 节 序列 数据 。 代 码 第 @ 行 是 将 字 节 序列 数据 转换 为 字符 串 。 


18.4.4 发 送 GET 请 求 


对 于 复杂 的 需求 ， 需 要 使 用 urllib.request.Request 对 象 才能 满足 。Request 对 象 需要 与 urlopen0 
函数 结合 使 用 。 
下 面 示例 代码 展示 了 通过 Request 对 象 发 送 HTTP/HTTPS 的 GET 请 求 过 程 。 


@@e 


# coding=utf-8 
# 代码 文件 ，chapter18/ch18.4.4.py 


import urllib.request 
import urllib.parse 


url = 'http://www.S5lwork6.com/service/mynotes/WebService.php' @ 
params_dict = {'email': < 换 成 自己 的 注册 邮箱 >，'type': 'JSON'，'action': 'query'} @ 
params_str = urllib.parse.urlencode (params_dict) @ 
print (params_str) 

url = url + '?' + params_str ## HTTP 参数 放 到 URL 之 后 四 


@ ”各 大 搜索 引擎 都 会 有 一 个 工具 一 一 搜索 引擎 机 器 人 ， 也 叫 作 “蜘蛛 ”， 它 会 自动 抓 取 网 站 信息 。 而 robots. 
txt 文件 是 放 在 网 站 根 目录 下 ， 告 诉 搜索 引擎 机 器 人 哪些 页 面 可 以 抓 取 ， 哪 些 不 可 以 抓 取 。 
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print (ur1) 


req = urllib.request.Request (url) 


加 加 


with urllib.request.urlopen (req) as response: 
data = response.read() 
json data = data.decode() 
print (json_data) 


上 述 代 码 第 Q@ 行 是 一 个 Web 服务 网 址 字符 串 。 代 码 第 @ 行 是 准备 HTTP 请 求 参数 ， 这 些 
参数 被 保存 在 字典 对 象 中 ， 键 是 参数 名 ， 值 是 参数 值 。 代 码 第 @ 行 使 用 urllib.parse.urlencode() 
函数 将 参数 字典 对 象 转换 为 参数 字符 串 ， 另 外 ，urlencode(0) 函数 还 可 以 将 普通 字符 串 转换 为 
URL 编码 字符 串 ， 例 如 “@ ”字符 URL 编码 为 “%40”。 代 码 第 @ 行 是 将 基本 的 URL 与 参数 
部 分 连接 起 来 ， 注 意 之 间 有 一 个 “?” 符 号 ， 表 示 之 后 要 发 送 的 参数 。 


提示 : 发 送 GET 请 求 时 发 送 给 服务 器 的 参数 是 放 在 URL“?” 之 后 的 ， 参数 采用 键 值 对 
形式 , 例如 ，type=JSON 是 一 个 参数 ，type 是 参数 名 ，JSON 是 参数 名 ,服务 器 端 会 根据 参数 
名 获得 参数 值 。 多 个 参数 之 间 用 “及 ”分 隔 ,， 例 如 type=JSON&action=query 就 是 两 个 参数 。 
所 有 的 URL 字符 串 必 须 采 用 URL 编码 才能 发 送 。 


代码 第 回 行 是 urllib.request.Request(url) 创建 Request 对象 ， 在 该 构造 方法 中 还 有 一 
个 data 参数 ， 如 果 data 参数 没有 指定 则 是 GET 请 求 ， 否 则 是 POST 请 求 。 代 码 第 @ 行 通过 
urllib.request.urlopen(req) 语句 发 送 网 络 请 求 。 


注意 : 比较 代码 第 @ 行 的 urlopen() 函数 与 18.4.3 节 代码 第 外 行 的 urlopen() 函数 ， 它 们 
的 参数 是 不 同 的 ，18.4.3 节 传递 的 是 URL 字符 串 ， 而 本 例 中 传递 的 是 Request 对 象 。 事 实 上 
urlopen() 函数 可 以 接收 两 种 形式 的 套数 ， 即 字符 串 和 Request 对 象 参 数 。 


输出 结果 如 下 : 


email=< 换 成 自己 的 注册 邮箱 >stype=JSON&action=query 

http://www.51work6.com/service/mynotes/WebService.php?email=< 换 成 自己 的 注册 邮箱 > 
&type=JSON&action=query 

{"ResultCode":0,"Record":[{"ID":5238, "CDate":"2017-05-18", "Content":" 欢迎 来 到 智 捷 
课堂 。"}, {"ID":5239, "CDate":"2018-10-18", "Content":"Welcome to zhijieketang."}]} 


提示 : 上 述 示例 中 URL 所 指向 的 Web 服务 是 由 作者 所 在 的 智 捷 课堂 提供 的 ， 读 者 要 想 使 
用 这 个 Web 服务 器 需要 在 www.51Work6.com 进行 注册 ， 注 册 时 需要 提供 有 效 的 邮箱 ， 这 个 邮 
箱 用 来 激活 用 户 。 在 代码 中 需要 将 < 换 成 自己 的 注册 邮箱 > 改 为 在 $1work6.com 注册 时 填写 
的 邮箱 ， 和 否则 无 法 成 功 查 询 数据 。 


18.4.5 发 送 POST 请 求 


本 节 介 绍 发 送 HTTP/HTTPS 的 POST 类 型 请 求 ， 下 面 示例 代码 展示 了 通过 Request 对 象 
发 送 HTTP/HTTPS 的 POST 请 求 过 程 。 


# coding=utf-8 
# 代码 文件 : chapterl8/ch18.4.5.py 


import urllib.request 
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import urllib.parse 


url = 'http://www.5lwork6.com/service/mynotes/WebService.php' 
# 准备 HTTP 参数 
params_dict = {'email': < 换 成 自己 的 注册 邮箱 >， "type': 'JSON','action': 'query'} 


params_str = urllib.parse.urlencode (params_dict) 
print (params_str) 


params_bytes = params_str.encode() # 字符 串 转换 为 字 节 序列 对 象 @ 


req = urllib.request.Request (url，data=params_bytes) “# 发 送 POsT 请 求 @ 
with urllib.request.urlopen (req) as response: 

data = response.read() 

json data = data.decode() 

print (json data) 


输出 结果 如 下 : 


email=< 换 成 自己 的 注册 邮箱 >&type=JSON&action=query 

{"ResultCode":0, "Record":[{"ID":5238,"CDate":"2017-05-18", "Content":" 欢迎 来 到 智 捷 
课堂 。"},{"ID":5239, "CDate":"2018-10-18","Content":"Welcome to zhijieketang."}]} 

上 述 代 码 与 GET 请 求 非常 类 似 ， 只 是 代码 第 中行 和 第 @ 行 有 所 区 别 。 代 码 第 @ 行 是 将 参 
数字 符 串 转换 为 参数 字 节 序列 对 象 ， 这 是 因为 发 送 POST 请 求 时 的 参数 要 以 字 节 序列 形式 发 
送 。 代 码 第 @ 行 是 创建 Request 对象， 其 中 提供 了 data 参数 ， 这 种 请 求 是 POST 请 求 。 


18.4.6 实例 : Downloader 
为 了 进一步 熟悉 urllib 类 ， 这 一 节 介绍 一 个 下 载 程序 Downloader， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l8/ch18.4.6.py 


import urllib.parse 


url = "https://ss0.bdstatic.com/5aVlbjqh Q23o0dCf/static/superman/img/logo/bd_ 
logol_31lbdc765.png' 


with urllib.request.urlopen (url) as response: [0 
data = response.read() 
f_ name = "download.png'" 
with open(f name, 'wb') as f: 
f.write (data) 


print (' 下 载 文件 成 功 ') 


上 述 代码 第 @ 行 通过 urlopen(url) 函数 打开 网 络 资源 ， 该 资源 是 一 张 图片 。 代 码 第 @ 行 以 
写 入 方式 打开 二 进 制 文件 download.png， 然 后 通过 代码 第 @ 行 f.write(data) 语句 将 从 网 络 返 回 
的 数据 写 入 到 文件 中 。 运 行 Downloader 程序 ， 如 果 成 功 会 在 当前 目录 获得 一 张 图 片 。 


本 章 小 结 


本 章 主要 介绍 了 Python 网 络 编程 ， 首 先 介绍 了 一 些 网 络 方面 的 基本 知识 ， 然 后 重点 介绍 
了 TCP Socket 编程 和 UDP Socket 编程 ， 其 中 TCP Socket 编程 很 有 代表 性 ， 希 望 读者 重点 掌 
握 这 部 分 知识 。 最 后 介绍 了 使 用 Python 提供 的 urllib 库 访问 互联 网 资源 。 


© 
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wxPython 图 形 用 户 界 面 编 程 


图 形 用 户 界面 (Graphical User Interface，GUD 编程 对 于 某 种 计算 机 语言 来 说 非常 重要 。 
可 开发 Python 图 形 用 户 界 面 的 工具 包 有 多 种 ， 本 章 介绍 wxPython 图 形 用 户 界面 工具 包 。 


19.1 Python 图 形 用 户 界 面 开 发 工具 包 


虽然 支持 Python 图 形 用 户 界面 开发 的 工具 包 有 很 多 ， 但 到 目前 为 止 还 没有 一 个 被 公认 回 嘎 
的 标准 的 工具 包 ， 这 些 工 具 包 各 有 自己 的 优 缺 点 。 较 为 突出 的 工具 包 有 Tkinter、PyQt 和 5 
WwWXPython 。 

1) Tkinter 

Tkinter 是 Python 官方 提供 的 图 形 用 户 界面 开发 工具 包 ， 是 对 Tk GUI 工具 包 封 装 而 来 的 。 
Tkinter 是 跨 平台 的 ， 可 以 在 大 多 数 的 UNIX、Linux、Windows 和 macOS 平台 中 运行 ，Tkinter 8.0 
之 后 可 以 实现 本 地 窗口 风格 。 使 用 Tkinter 工具 包 不 需要 额外 安装 软件 包 ， 但 Tkinter 工具 包 所 包 
含 控件 较 少 ， 开 发 复杂 图 形 用 户 界 面 时 显得 “力不从心 ” 而 且 Tkinter 工具 包 的 帮助 文档 不 健全 。 
2) pyQt 
PyQt 是 非 Python 官方 提供 的 图 形 用 户 界面 开发 工具 包 ， 是 对 Qt? 工 具 包 封装 而 来 的 ， 
PyQt 也 是 跨 平 台 的 。 使 用 PyQt 工具 包 需 要 额外 安装 软件 包 。 
3) wxPython 
wxPython 是 非 Python 官方 提供 的 图 形 用 户 界 面 开 发 工具 包 ， 它 的 官网 是 https:/ 
wxpython.org/。wxPython 是 对 wxWidgets 工具 包 封 装 而 来 的 ，wxPython 也 是 跨 平 台 的 ， 拥 
有 本 地 窗口 风格 。 使 用 wxPython 工具 包 需 要 额外 安装 软件 包 。 但 wxPython 工具 包 提 供 了 
丰富 的 控件 ， 可 以 开发 复杂 图 形 用 户 界 面 ， 而 且 wxPython 工具 包 的 帮助 文档 非常 完善 、 案 
例 丰富 。 因 此 推荐 使 用 wxPython 工具 包 开 发 Python 图 形 用 户 界 面 应 用 ， 这 也 是 本 书 介绍 
wxPython 的 一 个 主要 原因 。 


19.2 ”wxPython 安装 


于 是 非 Python 官方 工具 包 ， 所 以 使 用 wxPython 需要 额外 安装 ，wxPython 4.0 之 后 支 国 E 
持 pip 安装 ， 本 书 采 用 的 是 wxPython 4.0.1 版 本 。pip 是 Python 的 包 管理 工具 ， 可 以 在 线 安装 员 
Python 所 需 工 具 包 。 


回 " 
扫 码 看 视频 


@ Qt 是 一 个 跨 平台 的 C++ 应 用 程序 开发 框架 ， 广 泛 用 于 开发 GUI 程序 ， 也 可 用 于 开发 非 GUI 程序 。 
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在 Windows 和 macOS 平台 通过 pip 安装 wxPython 过 程 如 下 ， 打 开 命 令 提 示 (macOS 终 
端 )， 输 入 指令 如 下 : 


pip install -U wxPython 


其 中 install 是 安装 软件 包 ，-U 是 将 指定 软件 包 升 级 到 最 新 版 本 。 


如 果 在 Linux 平台 下 使 用 pip 安装 有 些 烦 琐 ， 例 如 在 Ubuntu 16.04 安装 ， 打 开 终 端 输入 如 
下 指令 : 


pip install -U \ 


-f£ https://extras.wxpython.org/wxPython4/extras/linux/gtk3/ubuntu-16.04 \ 
wxPython 


在 Windows 平 台 下 执行 pip 安装 指令 的 过 程 如 图 19-1 所 示 ， 最 后 会 有 安装 成 功 提示 ， 其 
他 平台 安装 过 程 也 是 类 似 的 ， 这 里 不 再 袭 述 。 


图 19-1 pip 安装 过 程 


除了 安装 wxPython 工具 包 外 ， 还 可 以 在 https://extras.wxpython.org/wxPython4/extras/ 网 
页 中 下 载 wxPython 的 帮助 文档 和 案例 。 


19.3 ”wxPython 基础 


wxPython 作为 图 形 用 户 界面 开发 工具 包 ， 主 要 提供 了 如 下 GUI 内 容 : 
(1) 窗口 ; 

(2) 控件 ; 

(3) 事件 处 理 ; 

(4) 布局 管理 。 


19.3.1 wxPython 类 层次 结构 


在 wxPython 中 所 有 类 都 直接 或 间接 继承 了 wx.Object，wx.Object 是 根 类 。 窗 口 和 控件 
是 构成 wxPython 的 主要 内 容 ， 下 面 分 别 介 绍 wxPython 中 的 窗口 类 (wx.Window) 和 控件 类 
(wx.ControD 层次 结构 。 

图 19-2 所 示 是 wxPython 窗口 类 层次 结构 ， 窗 口 类 主要 有 wx.Control、wx.NonOwnedWindow、 
wx.Panel 和 wx.MenuBar。wx.Control 是 控件 类 的 根 类 ; wx.NonOwnedWindow 有 一 个 直接 子 
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类 wx.TopLevelWindow， 它 是 项 级 窗口 ， 所 谓 “ 顶 级 窗口 ”就 是 作为 其 他 窗口 的 容器 ， 它 有 
两 个 重要 的 子 类 wx.Dialog 和 wx.Frame， 其 中 wx.Frame 是 构建 图 形 用 户 界面 的 主要 窗口 类 ; 
wx.Panel 称 为 面板 ， 是 一 种 容器 窗口 ， 它 没有 标题 、 图 标 和 窗口 按钮 。 


1 1 \ \ 
wx.Control wx.NonOwnedWindow wx.Panel wx.MenuBar 
[ \ 
IE Cede 


图 19-2 wxPython 窗口 类 层次 结构 


wx.Control 作为 控件 类 的 根 类 ， 可 见 在 wxPython 中 控件 也 属于 窗口 ， 因 此 也 称 为 “窗口 
部 件 ”(Window Widgets)， 注 意 本 书 中 还 是 统一 翻译 为 控件 。 图 19-3 所 示 是 wxPython 控件 类 
层次 结构 。 这 里 不 再 一 一 解释 了 ， 在 后 面 的 章节 中 会 重点 介绍 控件 。 


/ ee 轩 on 
ps \ 
/ \ 
A wx.RadioButton wx.ToggleButton 
/一 


ee wx.CheckBox 
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wxGauge 
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es wx.ScrollBar 
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wx.ToolBar 
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wx.TreeCtrl 


一 wx.StaticBox 


/ 
/ 
/ 


wx.StaticBitmap 


图 19-3 wxPython 控件 类 层次 结构 


19.3.2 ”第 一 个 wxPython 程序 
图 形 用 户 界面 主要 是 由 窗口 以 及 窗口 中 的 控件 构成 的 ， 编 写 wxPython 程序 主要 就 是 创建 
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窗口 和 添加 控件 过 程 。wxPython 中 的 窗口 主要 使 用 wx.Frame， 很 少 直接 使 用 wx.Window。 另 
外 ， 为 了 管理 窗口 还 需要 wx.App 对 象 ，wx.App 对 象 代表 当前 应 用 程序 。 

构建 一 个 最 简单 的 wxPython 程序 至 少 需要 一 个 wx.App 对 象 和 一 个 wx.Frame 对 象 。 示 例 
代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l9/ch19.3.2-1.py 


import wx 


# 创建 应 用 程序 对 象 
app = wx.App() 


# 创建 窗口 对 象 

frm = wx.Frame (None，title=" 第 一 个 GUI 程序 !"，size=(400，300)，pos=(100，100)) @ 
frm. Show() # 显示 窗口 @ 
app.MainLoop() # 进入 主事 件 循环 四 


上 述 代码 第 @ 行 是 创建 Frame 窗口 对 象 ， 其 中 第 一 个 参数 是 设置 窗口 所 在 的 父 容器 ， 由 于 
Frame 窗口 是 顶级 窗口 ， 没 有 父 容器 ;title 设置 窗口 标题 ，size 设置 窗口 大 小 ; pos 设置 窗口 位 
置 。 代 码 第 @ 行 设置 窗口 显示 ， 默 认 情 况 下 窗口 是 隐 
藏 的 。 

代码 第 图 行 app.MainLoop() 方法 使 应 用 程序 进 
入 主事 件 循环 "， 大 部 分 的 图 形 用 户 界面 程序 中 响应 
用 户 事 件 处 理 都 是 通过 主事 件 循 环 实现 的 。 

该 示例 运行 效果 如 图 19-4 所 示 ， 窗 口 标题 是 
“第 一 个 GUI 程序 !”， 窗 口中 没有 任何 控件 ， 背 景 
为 深 灰色 。 

ch19.3.2-1.py 示例 过 于 简单 ， 无 法 获得 应 用 程 
序 生命 周期 事件 处 理 ， 而 且 窗口 没有 可 扩展 性 。 修 图 19-4 示例 运行 效果 
改 上 述 代码 如 下 : 

# coding=utf-8 

# 代码 文件 chapter1l9/ch19.3.2-2.py 


import wx 


# 自 定义 窗口 类 MyFrame 


class MyFrame (wx.Frame): [oy 
def _init_ (self): 
super() . init (parent=None，title=" 第 一 个 GUI 程序 !"， size=(400，300) ， 
pos=(100, 100)) 
# TODO 


中 事件 循环 是 一 种 事件 或 消息 分 发 处 理 机 制 。 
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class App (wx.App): 


def OnInit (self): @ 
# 创建 窗口 对 象 
frame = MYFrame() 
frame.Show () 


return True 


def OnExit (self) : @ 
Print(' 应 用 程序 退出 ') 
return 0 
if _name == "'_ main_': @ 
app = App() 
app.MainLoop () # 进入 主事 件 循环 


上 述 代 码 第 @ 行 是 创建 自 定义 窗口 类 MyFrame。 代 码 第 @ 行 是 覆盖 父 类 wx.App 的 
OnInit() 方法 ， 该 方法 在 应 用 程序 启动 时 调用 ， 可 以 在 此 方法 中 进行 应 用 程序 的 初始 化 ， 该 方 
法 返回 值 是 布尔 类 型 ， 返 回 True 继续 运行 应 用 ， 返 回 False 则 立刻 退出 应 用 。 代 码 第 @ 行 是 覆 
盖 父 类 wx.App 的 OnExit() 方法 ， 该 方法 在 应 用 程序 退出 时 调用 ， 可 以 在 此 方法 中 释放 一 些 资 
源 ， 如 数据 库 连 接 等 。 

提示 : 代码 第 图 行为 什么 要 判断 主 模块 ? 这 是 因为 当 有 多 个 模块 时 ， 其 中 会 有 一 个 模块 是 
主 模块 ， 它 是 程序 运行 的 入 口 ， 这 类 似 于 C 和 Java 语言 中 的 main() 主 函 数 。 如 果 只 有 一 个 模 
块 时 ， 可 以 不 用 判断 是 否 主 模块 ， 可 以 不 用 主 函 数 ， 在 此 之 前 的 示例 都 是 没有 主 函 数 的 。 


ch19.3.2-2.py 示例 代码 的 Frame 窗口 中 并 没有 
其 他 的 控件 ， 下 面 提供 一 个 静态 文本 ， 显 示 Hello | haewendi 
World 字符 串 ， 运 行 效 果 如 图 19-5 所 示 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter1l9/ch19.3.2-3.py 


import wx 


# 自 定义 窗口 类 MyFrame 图 19-5 示例 运行 效果 
class MyFrame (wx.Frame): 
def _init (self): 
super() ._init (parent=None，title=" 第 一 个 GUI 程序 !"，size=(400，300) ) 


self.Centre() # 设置 窗口 居中 © 
panel = wx.Panel (parent=self) ©@ 
statictext = wx.StaticText (parent=panel, label='Hello World!', pos=(10, 10)) @ 


class App (wx.App): 
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def OnInit (self) : 
# 创建 窗口 对 象 
frame = MyFrame () 
frame.Show() 


return True 


if _name ==' main ': 
app = App() 
app.MainLoop () # 进入 主事 件 循环 
上 述 代码 第 @ 行 设置 声明 Frame 屏幕 居中 。 代 码 第 @ 行 创建 Panel 面板 对 象 ， 参 数 parent 
传递 的 是 self， 即 设置 面板 所 在 的 父 容器 为 Frame 窗口 对 象 。 代 码 第 @ 行 创建 静态 文本 对 象 ， 
StaticText 是 类 ， 静 态 文本 放 到 panel 面 板 中 ， 所 以 parent 参数 传递 的 是 panel， 参 数 label 是 
静态 文本 上 显示 的 文字 ， 参 数 pos 用 来 设置 静态 文本 的 位 置 。 


提示 : 控件 是 否 可 以 直接 放 到 Frame 窗口 中 ? 答案 是 可 
以 的 ，Frame 窗口 本 身 有 默认 的 布局 管理 ， 但 直接 使 用 默认 
布局 会 有 很 多 问题 。 本 例 中 把 面板 放 到 Frame 窗口 中 ， 然 后 
再 把 控件 (菜单 栏 除 外 ) 添加 到 面板 上 ， 这 种 面板 称 为 “内 
容 面板 ”。 如 图 19-6 所 示 ， 内 容 面板 是 Frame 窗口 中 包含 的 
一 个 内 容 面板 和 菜单 栏 。 


图 19-6 Frame 的 内 容 面 板 


19.3.3 wxPython 界面 构建 层次 结构 


几乎 所 有 的 图 形 用 户 界面 技术 ， 在 构建 界面 

时 都 采用 层级 结构 ( 树 形 结构 ) 。 如 图 19-7 所 示 ， 

根 是 顶级 窗口 (只 能 包含 其 他 窗口 的 容器 )， 子 控 二 

件 有 内 容 面板 和 菜单 栏 本 例 中 没有 菜单 )， 然 后 
其 他 的 控件 添加 到 内 容 面板 中 ， 通 过 控件 或 窗口 


注意 : 图 19-7 所 示 的 关系 不 是 继承 关系 ， 而 
是 一 种 包含 层次 关系 。 即 Frame 中 包含 面板 ， 面 


板 中 包含 静态 文本 。 窗 口 的 Parent 属性 设置 也 不 


是 继承 关系 ， 是 包含 关系 。 人 
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19.4 ”事件 处 理 


图 形 界面 的 控件 要 响应 用 户 操 作 ， 就 必须 添加 事件 处 理 机 制 。 在 事件 处 理 的 过 程 中 涉及 以 
下 4 个 要 素 。 
(1) 事件 : 它 是 用 户 对 界面 的 操作 ， 在 wxPython 中 事件 被 封装 成 为 事件 类 wx.Event 及 其 a 
子 类 ， 例 如 按钮 事件 类 是 wx.CommandEvent， 鼠 标 事件 类 是 wx.MoveEvent。 
(2) 事件 类 型 : 事件 类 型 给 出 了 事件 的 更 多 信息 ， 它 是 一 个 整数 ， 例 如 鼠标 事件 wx.MoveEvent 
还 可 以 有 鼠标 的 右键 按 下 (wx.EVT_LEFT_DOWN) 和 释放 (wx.EVT_LEFT_UP) 等 。 
(3) 事件 源 : 它 是 事件 发 生 的 场所 ， 就 是 各 个 控件 ， 例 如 按钮 事件 的 事件 源 是 按钮 。 
(4) 事件 处 理 者 : 它 是 在 wx.EvtHandler 子 类 (事件 处 理 类 ) 中 定义 的 一 个 方法 。 
在 事件 处 理 中 最 重要 的 是 事件 处 理 者 ，wxPython 中 所 有 窗口 和 控件 都 是 wx.EvtHandler 的 
子 类 。 在 编程 时 需要 绑 定 事件 源 和 事件 处 理 者 ， 这 样 当 事 件 发 生 时 系统 就 会 调用 事件 处 理 者 。 
绑 定 是 通过 事件 处 理 类 的 Bind0 方法 实现 的 ，Bind0 方法 语法 如 下 : 


Bind(self, event, handler, source=None, id=wx.ID ANY, id2=wx.ID ANY) 


其 中 参数 event 是 事件 类 型 ， 注 意 不 是 事件 ，handler 是 事件 处 理 者 ， 它 对 应 事件 处 理 类 中 的 特 

定 方法 ，source 是 事件 源 ; id 是 事件 源 的 标识 ， 可 以 省 略 source 参数 通过 id 绑 定 事件 源 ，id2 

设置 要 绑 定 事 件 源 的 id 范围 ， 当 有 多 个 事件 源 绑 定 到 同一 个 事件 处 理 者 时 可 以 使 用 此 参数 。 
另外 ， 如 果 不 再 需要 事件 处 理 时 ， 最 好 调用 事件 处 理 类 的 Unbind() 方法 解除 绑 定 。 


19.4.1 一 对 一 事件 处 理 


实际 开发 时 多 数 情况 下 是 一 个 事件 处 理 者 对 应 一 个 事件 源 。 本 节 通 过 示例 介绍 这 种 一 对 一 
事件 处 理 。 如 图 19-8 所 示 的 示例 ， 窗 口中 有 一 个 按钮 和 一 个 静态 文本 ， 单 击 OK 按钮 后 会 改 
变 静 态 文本 显示 的 内 容 。 


图 19-8 一 对 一 事件 处 理 示例 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ;chapterl9/ch19.4.1.py 


import wx 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init (self): 
super() ._init (parent=None，title=' 一 对 一 事件 处 理 '，size=(300，180)) 
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self.Centre() # 设置 窗口 居中 
panel = wx.Panel (parent=self) 
self.statictext = wx.StaticText (parent=panel, pos=(110, 20)) ©@ 
b = wx.Button (parent=panel, label='OK', pos=(100, 50)) 
self.Bind (wx.EVT BUTTON, self.on click, b) 


def on click(self, event): 
print (type(event)) # <class 'wx._core.CommandEvent'> 
self.statictext.SetLabelText ('Hello, world.') 


@ © @e@e 


class App (wx.App): 


def OnInit (self): 
# 创建 窗口 对 象 
frame = MyFrame() 
frame.Show() 
return True 


if _name == '_ main_': 
app = App() 
app.MainLoop () # 进入 主事 件 循环 
上 述 代码 第 @ 行 创建 静态 文本 对 象 statictext， 它 被 定义 为 成 员 变量 ， 目 的 是 要 在 事件 处 理 
方法 中 访问 ， 见 代码 第 @ 行 。 代 码 第 @ 行 是 创建 按钮 对 象 。 代 码 第 @ 行 是 绑 定 事件 ，self 是 当 
前 窗口 对 象 ， 它 是 事件 处 理 类 ，wx.EVT_BUTTON 是 事件 类 型 ，on_click 是 事件 处 理 者 , b 是 
事件 源 。 代 码 第 @ 行 是 事件 处 理 者 ， 在 该 方法 中 处 理 按钮 单 击 事件 。 


19.4.2 一 对 多 事件 处 理 


实际 开发 时 也 会 遇 到 一 个 事件 处 理 者 对 应 多 个 事件 源 的 情况 。 本 节 通 过 示例 介绍 这 种 一 
对 多 事件 处 理 。 如 图 19-9 所 示 的 示例 ， 窗 口中 有 两 个 按钮 和 一 个 静态 文本 ， 单 击 Buttonl 或 
Button2 按钮 后 会 改变 静态 文本 显示 的 内 容 。 


(a ) Buttonl 单 击 (b ) Button2 单 击 
图 19-9 一 对 多 事件 处 理 示例 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl9/ch19.4.2.py 


import wx 
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# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init (self): 
super() ._init (parent=None，title=' 一 对 多 事件 处 理 '，size=(300，180)) 
self.Centre () # 设置 窗口 居中 
panel = wx.Panel (parent=self) 
self.statictext = wx.StaticText (parent=panel, pos=(110, 15)) 


bl = wx.Button (parent=panel, id=10, label='Buttonl', pos=(100, 45)) © 
b2 = wx.Button (parent=panel, id=11, label='Button?2', pos=(100, 85)) @ 
self.Bind (wx.EVT BUTTON, self.on click, bl1) @ 
self.Bind (wx.EVT BUTTON, self.on click, id=11) @ 
def on click(self, event): 

event_id = event.GetId() © 
print (event _ id) 

if event id == 10: 

self.statictext.SetLabelText ('Buttonl 单 击 ') 

else: 


self.statictext.SetLabelText ('Button2 单 击 ') 


class App (wx.App): 


def OnInit (self): 
# 创建 窗口 对 象 
frame = MyFrame() 
Erame.Show() 
return True 


if _name == '_ main_': 
app = App() 
app.MainLoop () # 进入 主事 件 循环 


上 述 代码 第 四 行 和 第 @@ 行 分 别 创建 了 两 个 按钮 对 象 ， 并 且 都 设置 了 id 参数 。 代 码 第 @ 
行 通过 事件 源 对 象 bl 绑 定 事件 。 代 码 第 @ 行 通过 事件 源 对 象 id 绑 定 事件 。 这 样 Buttonl 和 
Button2 都 绑 定 到 了 on_click 事件 处 理 者 ， 那 么 如 何 区 分 是 单 击 了 Buttonl 还 是 Button2 呢 ? 
可 以 通过 事件 标识 判断 ，event.GetIdO 可 以 获得 事件 标识 ， 见 代码 第 @ 行 ， 事 件 标识 就 是 事件 
源 的 id 属性 。 代 码 第 @ 行 判断 事件 标识 ， 进 而 可 知 是 哪 一 个 按钮 单 击 的 事件 。 

如 果 使 用 id2 参数 代码 ， 第 @ 行 和 第 @ 行 两 条 事件 绑 定 语句 可 以 合并 为 一 条 。 蔡 代 语 句 如 下 : 


self.Bind (wx.EVT BUTTON, self.on click, id=10, id2=20) 


其 中 参数 id 设置 id 开始 范围 ，id2 设置 id 结束 范围 ， 凡 是 事件 源 对 象 id 在 10~20 内 的 都 被 绑 
定 到 on_clickO 事件 处 理 者 上 。 


19.4.3 示例 : 鼠标 事件 处 理 
实际 开发 时 还 会 遇 到 更 加 复杂 的 情况 ， 例 如 事件 源 与 事件 处 理 对 象 是 同一 个 。 
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下 面 通过 鼠标 事件 处 理 示 例 介绍 事件 源 与 事件 处 理 对 象 是 同一 个 的 情况 。 示 例 主要 代码 
如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl9/ch19.4.3.py 


import wx 
# 自 定义 窗口 类 MyFrame 


class MyFrame (wx.Frame): 
def _ init_ (self): 


super()._init (parent=None，title=" 鼠标 事件 处 理 "，size=(400，300)) 
self.Centre() # 设置 窗口 居中 

self.Bind (wx.EVT_ LEFT DOWN, self.on left down) O 
self.Bind(wx.EVT LEFT UP, self.on left up) @ 
self.Bind(wx.EVT MOTION, self.on mouse move) 加 


def on_left_down(self，evt) : 
print(' 鼠标 按 下 ') 


def on_left_up(self，evt) : 
print (' 鼠标 释放 ') 


def on mouse move(self, event): 
if event.Dragging() and event.LeftIsDown(): 
pos = event.GetPosition() 


四 @ 


print (pos) 


上 述 代码 第 @ 行 绑 定 鼠标 按 下 事件 ， 事 件 源 和 事件 处 理 对 象 都 是 当前 Frame 对 象 ， 其 中 
wx.EVT_LEFT_DOWN 是 鼠标 按 下 事件 类 型 。 类 似 的 还 有 代码 第 @ 行 和 第 @ 行 ， 代 码 第 @ 行 
绑 定 鼠标 按 下 事件 ，wx.EVT_LEFT_DOWN 是 鼠标 释放 事件 类 型 ， 代 码 第 @ 行 绑 定 鼠标 移动 
事件 ，wx.EVT_MOTION 是 鼠标 移动 事件 类 型 。 

在 处 理 鼠 标 移动 事件 on_mouse_move0 方法 中 ， 代 码 第 @ 行 判断 是 否 是 按 着 鼠标 右键 拖 
电 ， 代 码 第 @@ 行 用 event.GetPosition() 方法 获得 鼠标 的 位 置 。 


19.5 布局 管理 


图 形 用 户 界 面 的 窗口 中 可 能 会 有 很 多 子 窗口 或 控件 ， 它 们 如 何 布局 (排列 顺序 、 大 小 、 位 
置 等 )， 当 父 窗口 移动 或 调整 大 小 后 它们 如 何 变化 等 ， 这 些 问 题 都 属于 布局 问题 。 本 节 介 绍 
bi wxPython 布局 管理 。 

图 形 用 户 界面 中 的 布局 管理 是 一 个 比较 麻烦 的 问题 ， 在 wxPython 中 可 以 通过 两 种 方式 实 
现 布 局 管理 ， 即 绝对 布局 和 Sizer 管理 布局 。 绝 对 布局 就 是 使 用 具体 数值 设置 子 窗口 或 控件 的 
位 置 和 大 小 ， 它 不 会 随 着 父 窗口 移动 或 调整 大 小 后 而 变化 ， 例 如 下 面 的 代码 片段 。 
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super() ._init (parent=None，title=' 一 对 一 事件 处 理 '，size=(300，180)) 
panel = wx.Panel (parent=self) 

self.statictext = wx.StaticText (parent=panel, pos=(110, 15)) 

bl = wx.Button (parent=panel, id=10, label='Buttonl', pos=(100, 45)) 
b2 = wx.Button (parent=panel, id=11, label='Button2', pos=(100, 85)) 


其 中 的 size=(300, 180) 和 pos=(110, 15) 等 都 属于 绝对 布局 。 使 用 绝对 布局 会 有 如 下 问题 。 

(1) 子 窗口 (或 控件 ) 位 置 和 大 小 不 会 随 着 父 窗口 的 变化 而 变化 。 

(2) 在 不 同 平台 上 显示 效果 可 能 差别 很 大 。 

(3) 在 不 同 分 辩 率 下 显示 效果 可 能 差别 很 大 。 

(4) 字体 的 变化 也 会 对 显示 效果 有 影响 。 

(5) 动态 添加 或 删除 子 窗口 (或 控件 ) 后 界面 布局 需要 重新 设计 。 

基于 以 上 原因 ， 布 局 管理 尽量 不 要 采用 绝对 布局 方式 ， 而 应 使 用 布局 管理 器 管理 布 
局 。wxPython 提供 了 8 个 布局 管理 器 类 ， 如 图 19-10 所 示 ， 包 括 wx.Sizer、wx.BoxSizer、 
Wx.StaticBoxSizer、wx.WrapSizer、wx.StdDialogButtonSizer、wx.GridSizer、wx.FlexGridSizer 
和 wx.GridBagSizer。 其 中 wx.Sizer 是 布局 管理 器 的 根 类 ， 一般 不 会 直接 使 用 wx.Sizer, 
而 是 使 用 它 的 子 类 ， 最 常用 的 有 wx.BoxSizer、wx.StaticBoxSizer、wx.GridSizer 和 
wx.FlexGridSizer。 下 面 重点 介绍 这 4 种 布局 器 。 


EE ; 
pi a ys 
wx.StaticBoxSizer \ wx WrapSizer FE 

\ 
| 
wx.StdDialogButtonSizer wx.GridBagSizer 


图 19-10 wx.Sizer 类 层次 结构 


19.5.1 Box 布局 器 


Box 布局 器 类 是 wx.BoxSizer，Box 布局 器 是 所 有 布局 中 最 常用 的 ， 它 可 以 让 其 中 的 子 窗 
口 (或 控件 ) 沿 垂直 或 水 平方 向 布局 ， 创 建 wx.BoxSizer 对 象 时 可 以 指定 布局 方向 。 


hbox = wx.BoxSizer (wx.HORIZONTAL) # 设置 为 水 平方 向 布局 
hbox = wx.BoxSizer() # 也 是 设置 为 水 平方 向 布局 ，wx .HORIZONTAL 是 默认 值 可 以 省 略 
vhbox = wx.BoxSizer (wx.VERTICAL) # 设置 为 垂直 方向 布局 


当 需 要 添加 子 窗口 (或 控件 ) 到 父 窗口 时 ， 需 要 调用 wx.BoxSizer 对 象 Add() 方法 ，Ad4d() 
方法 是 从 父 类 wx.Sizer 继承 而 来 的 ，Add0 方法 的 语法 说 明 如 下 : 
Add (window, proportion=0, flag=0, border=0, userData=None) # 添加 到 父 窗口 


Add (sizer, proportion=0, flag=0，border=0，userData=None) “# 添加 到 另外 一 个 Sizer 中 ， 用 于 幅 套 
Add (width, height, proportion=0， flag=0，border=0，userData=None) # 添加 一 个 空白 空间 


其 中 proportion 参数 仅 被 wx.BoxSizer 使 用 ， 用 来 设置 当前 子 窗 口 (或 控件 ) 在 父 窗口 所 占 空 
间 比 例 ; flag 是 参数 标志 ， 用 来 控制 对 齐 、 边 框 和 调整 尺寸 , border 参数 用 来 设置 边框 的 宽度 ; 
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userData 参数 可 被 用 来 传递 额外 的 数据 。 
下 面 重点 介绍 flag 标志 。flag 标志 可 以 分 为 对 齐 、 边 框 和 调整 尺寸 等 不 同方 面 ， 对 齐 flag 
标志 如 表 19-1 所 示 ， 边 框 flag 标志 如 表 19-2 所 示 ， 调 整 尺 寸 flag 标志 如 表 19-3 所 示 。 


表 19-1 对 齐 flag 标志 


标 志 说 明 
wx.ALIGN_TOP 顶 对 齐 
wx.ALIGN_BOTTOM 底 对 齐 
wx.ALIGN_LEFT 左 对 齐 
wx.ALIGN_RIGHT 右 对 齐 
wx.ALIGN_CENTER 居中 对 齐 
wx.ALIGN_CENTER_VERTICAL 垂直 居中 对 齐 
wx.ALIGN_CENTER_HORIZONTAL 水 平 居 中 对 齐 
wx.ALIGN_CENTRE 同 wx.ALIGN_CENTER 
wx.ALIGN_CENTRE VERTICAL 同 wx.ALIGN_CENTER_VERTICAL 
wx.ALIGN_CENTRE HORIZONTAL 同 wx.ALIGN_CENTER_HORIZONTAL 


表 19-2 边框 flag 标志 


标 志 说 明 

wx.TOP 设置 有 顶部 边框 ， 边 框 的 宽度 需要 通过 Add0 方法 的 border 参数 设置 

wx.BOTTOM 设置 有 底部 边框 

wx.LEFT 设置 有 左边 框 

wx.RIGHT 设置 有 右边 框 

wx.ALL 设置 4 面 全 有 边框 

表 19-3 调整 尺寸 flag 标志 
标 志 说 明 

wx.EXPAND 调整 子 窗口 〈 或 控件 ) 完全 填 满 有 效 空间 
wx.SHAPED 调整 子 窗口 ( 或 控件 ) 填充 有 效 空间 ， 但 保存 高 宽 比 


wx.FIXED_MINSIZE 
wx.RESERVE_SPACE_EVEN_IF_HIDDEN 


调整 子 窗口 ( 或 控件 ) 为 最 小 尺寸 
设置 此 标志 后 ， 子 窗口 (或 控件 ) 如 果 被 隐藏 ， 所 占 空间 保留 


下 面 通过 一 个 示例 熟悉 Box 布局 ， 该 示例 窗口 如 图 19-11 


所 示 ， 其 中 包括 两 个 按钮 和 一 个 静态 文本 。 Button1 单 二 
示例 代码 如 下 : [ewem | Button2 


# coding=utf-8 


# 代码 文件 : chapter19/ch19.5.1.py 图 19-11 Box 布 局 示例 


import wx 


# 自 定义 窗口 类 MyFrame 


class MyFrame (wx.Frame): 
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def _init (self): 
super()._ init (parent=None，title='Box 布局 '，size=(300，120)) 
self.Centre() # 设置 窗口 居中 
panel = wx.Panel (parent=self) 
# 创建 垂直 方向 的 Box 布局 管理 器 对 象 
vbox = Wwx.BoxSizer (wx.VERTICAL) [0 
self.statictext = wx.StaticText (parent=panel, label='Buttonl 单 击 ') 
# 添加 静态 文本 到 垂直 Box 布局 管理 器 
vbox.Add (self.statictext, proportion=2, flag=wx.FIXED MINSIZE | wx.TOP | 
Wx.CENTER, border=10) [2 


bl = wx.Button (parent=panel, id=10, label='Buttonl') 

b2 = wx.Button (parent=panel, id=1l1, label='Button2') 

self.Bind (wx.EVT BUTTON, self.on click, id=10, id2=20) 

# 创建 水 平方 向 的 Box 布局 管理 器 对 象 

hbox = wx.BoxSizer (wx.HORIZONTAL) 

# 添加 bl 到 水 平 Box 布局 管理 

hbox.Add (bl, 0, wx.EXPAND | wx.BOTTOM, 5) 

# 添加 b2 到 水 平 Box 布局 管理 

hbox.Add(b2, 0, wx.EXPAND | wx.BOTTOM, 5) © 


# 将 水 平 Box 布局 管理 器 到 垂直 Box 布局 管理 器 
vbox.Add (hbox，PFoportion=1，fag=wx.CENTER) 


panel.SetSizer (vbox) 


def on click(self, event): 
event_id = event.GetId() 
print (event_ id) 
if event id == 10: 
self.statictext.SetLabelText ('Buttonl 单 击 ') 
else: 
self.statictext.SetLabelText('Button2 单 击 ') 


上 述 代 码 中 使 用 了 wx.BoxSizer 媒 套 。 整 个 窗口 都 放 在 了 一 个 垂直 方向 布局 的 
WwWX.BoxSizer 对 象 vbox 中 。vbox 上 面 是 一 个 静态 文本 ， 下 面 是 水 平方 向 布局 的 wx.BoxSizer 
对 象 hbox。hbox 中 有 左右 两 按钮 (Buttonl 和 Button2 ) 。 

代码 第 @@ 行 是 创建 垂直 方向 Box 布局 管理 器 对 象 。 代 码 第 @@ 行 是 添加 静态 文本 对 
象 statictext 到 Box 布局 管理 器 其 中 参数 flag 标 志 设 置 wx.FIXED_MINSIZE | wx.TOP | 
wx.CENTER，wx.FIXED_MINSIZE | wx.TOP | wx.CENTER 是 位 或 运算 ， 即 几 个 标志 效果 的 
县 加 。 参 数 proportion 为 2。 注 意 代码 第 @ 行 使 用 了 Add() 方法 添加 hbox 到 vbox， 其 中 参数 
proportion 为 1， 这 说 明 静 态 文 本 statictext 占用 vbox 三 分 之 一 空间 ，hbox 占用 vbox 三 分 之 二 
空间 。 

代码 第 @ 行 创建 水 平方 向 的 Box 布局 管理 器 对 象 ， 代 码 第 @ 行 添加 bl 到 水 平 Box 布局 管 
理 , 代码 第 @@ 行 添加 b2 到 水 平 Box 布局 管理 。 


| 
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19.S.2 ”StaticBox 布局 


StaticBox 布局 类 是 wx.StaticBoxSizer， 继 承 于 wx.BoxSizer。StaticBox 布局 等 同 于 Box， 
只 是 在 Box 周围 多 了 一 个 附加 的 带 静 态 文本 的 边框 。wx.StaticBoxSizer 构造 方法 如 下 : 

。 wx.StaticBoxSizer(box, orient=HORIZONTAL): box 参数 是 wx.StaticBox (静态 框 ) 对 象 ， 

orient 参数 是 布局 方向 ; 

。 wx.StaticBoxSizer(orient, parent, label="") : orient 参数 是 布局 方向 ，parent 参数 是 设置 

所 在 父 窗口 ，label 参数 设置 边框 的 静态 文本 。 

下 面 通过 一 个 示例 熟悉 StaticBox 布局 ， 该 示例 窗口 如 图 
19-12 所 示 ， 其 中 包括 两 个 按钮 和 一 个 静态 文本 ， 两 个 按钮 放 到 
一 个 StaticBox 布局 中 。 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl9/ch19.5.2.py 


图 19-12 ”StaticBox 布局 示例 


import wx 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init_ (self): 
super()._init (parent=None, title='StaticBox 布 局 ',，size=(300,，120)) 
self.Centre() # 设置 窗口 居中 
Panel = wx.Panel (parent=self) 
# 创建 垂直 方向 的 Box 布局 管理 器 对 象 
Vbox = WXx.BoxSizer (wx.VERTICAL) 
self.statictext = wx.StaticText (parent=panel，1abel='Buttonl 单 击 ') 
# 添加 静态 文本 到 Box 布局 管理 器 
Vbox.Add (self.statictext, proportion=2, flag=wx.FIXED MINSIZE | wx.TOP | 
WX.CENTER, border=10) 


bl = wx.Button (parent=panel, id=10, label='Buttonl') 
b2 = wx.Button (parent=panel, id=11, label='Button2') 
self.Bind (wx.EVT_ BUTTON, self.on click, id=10, id2=20) 


# 创建 静态 框 对 象 

sb = wx.StaticBox (panel，1label=" 按钮 框 ") @O 
# 创建 水 平方 向 的 StaticBox 布局 管理 器 

hsbox = wx.StaticBoxSizer(sb, wx.HORIZONTAL) ©@ 


# 添加 bl 到 水 平 StaticBox 布局 管理 
hsbox.add(b1，0，wx.EXPRND | wx.BOTTOM, 5) 
# 添加 b2 到 水 平 StaticBox 布局 管理 
hsbox.Add(b2, 0, wx.EXPAND | wx.BOTTOM, 5) 


# 添加 hbox 到 vbox 
vbox.Add (hsbox, proportion=1, flag=wx.CENTER) 


panel .SetSizer (vbox) 
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def on click(self, event): 
event id = event.GetId() 
print (event_id) 
if event id == 10: 
self.statictext.SetLabelText ('Buttonl 单 击 ') 
else: 
self.statictext.SetLabelText('Button2 单 击 ') 


上 述 代 码 第 @ 行 是 创建 静态 框 对 象 ， 代 码 第 @ 行 是 创建 水 平方 向 的 wx.StaticBoxSizer 对 
象 。wx.StaticBoxSizer 与 wx.BoxSizer 其 他 使 用 方法 类 似 ， 这 里 不 再 袭 述 。 


19.5.3 ”Grid 布局 


Grid 布局 类 是 wx.GridSizer，Grid 布局 以 网 格 形式 对 子 窗口 (或 控件 ) 进行 摆 放 ， 容 器 被 
分 成 大 小 相等 的 矩形 ， 一 个 矩形 中 放置 一 个 子 窗口 (或 控件 ) 。 

wx.GridSizer 构造 方法 有 如 下 几 种 。 

1) wx.GridSizer(rows, cols, vgap, hgap) 

创建 指定 行 数 和 列 数 的 wx.GridSizer 对 象 ， 并 指定 水 平和 垂直 间隙 ， 参 数 hgap 是 水 平 间 阶 ， 
参数 vgap 是 垂直 间隙 。 添 加 的 子 窗口 (或 控件 ) 个 数 超过 rows 与 cols 之 积 ， 则 引发 异常 。 

2) wx.GridSizer(rows, cols, gap) 

同 GridSizer(rows, cols, vgap, hgap)，gap 参数 指定 垂直 间隙 和 水 平 间隙 ，gap 参数 是 
wx.Size 类 型 ， 例 如 wx.Size(2,3) 是 设置 水 平 间 隙 为 2 像素 ， 垂 直 间隙 为 3 像素 。 

3) wx.GridSizer(cols, vgap, hgap) 

创建 指定 列 数 的 wx.GridSizer 对 象 ， 并 指定 水 平和 垂直 间隙 。 由 于 没有 限定 行 数 ， 所 以 添 
加 的 子 窗口 (或 控件 ) 个 数 没 有 限制 。 

4) wx.GridSizer(cols, gap= wx.Size(0.0)) 

同 GridSizer(cols, vgap, hgap)，gap 参数 是 垂直 间隙 和 水 平 间隙 ， 属 于 wx.Size 类 型 。 


下 面 通过 一 个 示例 熟悉 Grid 布局 ， 该 示例 窗口 如 图 19-13 ”EE O 
所 示 ， 其 中 窗口 中 包含 3 行 3 列 共 9 个 按钮 。 

示例 代码 如 下 : 和 E 

# coding=utf-8 | 

# 代码 文件 : chapter19/ch19.5.3.py 3 I 


import wx 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 图 19-13 ”Grid 布局 示例 
def _init (self): 
super()._init (parent=None，title="Grid 布 局 '，size=(300，300)) 
self.Centre() # 设置 窗口 居中 


panel = wx.Panel (self) 
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btnl = wx.Button (panel, label="1"') 
btn2 = wx.Button (panel, label='2') 
btn3 = wx.Button (panel, label="'3') 
btn4 = wx.Button(panel, label="'4') 
btn5 = wx.Button (panel, label='5') 
btn6 = wx.Button(panel, label="'6') 
btn7 = wx.Button (panel, label='7') 
btn8 = wx.Button(panel, label="'8') 
btn9 = wx.Button(panel, label="'9') 


grid = wx.GridSizer (cols=3, rows=3, vgap=0, hgap=0) 


grid.Add(btnl, 0, wx.EXPAND) 
grid.Add(btn2, 0, wx.EXPAND) 
grid.Add (btn3, 0, wx.EXPAND) 
grid.Add(btn4, 0, wx.EXPAND) 
grid.Add (btn5, 0, wx.EXPAND) 
grid.Add(btn6, 0, wx.EXPAND) 
grid.Add (btn7, 0, wx.EXPAND) 
grid.Add(btn8, 0, wx.EXPAND) 
grid.Add (btn9, 0, wx.EXPAND) [(@) 


panel.SetSizer (grid) 


上 述 代 码 第 @ 行 是 创建 一 个 3 行 3 列 wx.GridSizer 对 象 ， 其 水 平 间隙 为 0 像素 ， 垂 直 间 阶 
为 0 像素。 代码 第 @ 行 和 第 @ 行 添加 了 9 个 按钮 到 wx.GridSizer 对 象 中 ，Add() 方法 一 次 只 能 
添加 一 个 子 窗口 (或 控件 )， 如 果 想 一 次 添加 多 个 可 以 使 用 AddMany0 方法 ，AddMany() 方法 
参数 是 一 个 子 窗口 (或 控件 ) 的 列表 ， 因 此 代码 第 @ 行 和 第 @ 行 可 以 使 用 以 下 代码 替换 。 


grid.AddMany([ 
(btnl, 0, wx.EXPAND), 
(btn2, 0, wx.EXPAND), 
(btn3, 0, wx.EXPAND), | 
(btn4, 0, wx.EXPAND), " 2 
(btn5, 0, wx.EXPAND), 
(btn6, 0, wx.EXPAND), | 
(btn7, 0, wx.EXPAND), 4 5 | 6 
(btn8, 0, wx.EXPAND), 
(btn9, 0, wx.EXPAND) 


]) 

Grid 布局 将 窗口 分 成 几 个 区 域 ， 也 会 出 现 某 个 区 域 缺少 子 窗 
口 (或 控件 ) 情况 ， 如 图 19-14 所 示 只 有 7 个 子 窗口 (或 控件 ) 。 图 19-14 缺少 子 窗 口 (或 控件 ) 

19.5.4 FlexGrid 布局 


Grid 布局 时 网 格 大 小 是 固定 的 ， 如 果 想 网 格 大 小 不 同 可 以 使 用 FlexGrid 布局 。FlexGrid 
是 更 加 灵活 的 Grid 布局 。FlexGrid 布局 类 是 wx.FlexGridSizer， 它 的 父 类 是 wx.GridSizer。 
wx.FlexGridSizer 的 构造 方法 与 wx.GridSizer 相同 ， 这 里 不 再 效 述 。wx.FlexGridSizer 有 
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两 个 特殊 方法 如 下 。 
。AddGrowableRow(idx, proportion=0) : 指定 行 是 可 扩展 的 ， 参 数 idx 是 行 索引 ， 从 零 开 
始 ; 参数 proportion 设置 该 行 所 占 空间 比例 。 
。AddGrowableCol(idx, proportion=0): 指定 列 是 可 扩展 的 ， 参 数 idx 是 列 索 引 ， 从 零 开 始 ; 
参数 proportion 设置 该 列 所 占 空间 比例 。 
上 述 方法 中 的 proportion 参数 默认 是 0， 表 示 各 个 行列 占用 空间 是 均等 的 。 
下 面 通 过 一 个 示例 熟悉 FlexGrid 布局 ， 该 示例 窗口 
如 图 19-15 所 示 ， 其 中 窗口 中 包含 3 行 2 列 共 6 个 网 格 ， : 
第 一 列 放置 的 都 是 静态 文本 ， 第 二 列 放置 的 都 是 文本 输 ”| naa: 
入 控件 。 Ws: 
示例 代码 如 下 : y 


# coding=utf-8 图 19-15 FlexGrid 布局 示例 
# 代码 文件 ， chapter1l9/ch19.5.4.py 


import wx 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init_ (self): 
super()._ init (parent=None, title='FlexGrid 布 局 ',，size=(400,，200)) 
self.Centre() # 设置 窗口 居中 


panel = wx.Panel (parent=self) 
fgs = wx.FlexGridSsizer(3, 2, 10, 10) [Oy) 


title = wx.StaticText (panel,，label=" 标题 : ") 
author = wx.StaticText (panel，label=" 作者 名 : ") 
review = WX.StaticText(panel，1abel=" 内 容 : ") 


tcl = wx.TextCtrl (panel) 
tc2 = wx.TextCtrl (panel) 
tc3 = wx.TextCtrl (panel, style=wx.TE MULTILINE) 


fgs.AddMany ([title, (tcl, 1, wx.EXPAND), 
author, (tc2, 1, wx.EXPAND), 
review, (tc3, 1, wx.EXPAND)]) 


fgs.AddGrowableRow (0, 1) 
fgs.AddGrowableRow (1, 1) 
fgs.AddGrowableRow (2, 3) 
fgs.AddGrowableCol1 (0, 1) 
fgs.AddGrowableCol (1, 2) 


Geee@ © 


hbox = wx.BoxSizer (wx.HORIZONTAL) 
hbox.Add (fgs, proportion=1, flag=wx.ALL | wx.EXPAND, border=15) 


© 


panel.SetSsizer (hbox) 
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上 述 代 码 第 四 行 是 创建 一 个 3 行 2 列 的 wx.FlexGridSizer 对 象 ， 其 水 平 间 隙 为 10 像素 ， 
垂直 间隙 为 10 像素 。 代 码 第 @ 行 是 添加 控件 到 wx.FlexGridSizer 对 象 中 。 

代码 第 @ 行 是 设置 第 一 行 可 以 扩展 ， 所 占 空间 比例 是 1/5 ; 代码 第 @ 行 是 设置 第 二 行 可 以 
扩展 ， 所 占 空间 比例 是 1/5; 代码 第 @ 行 是 设置 第 三 行 可 以 扩展 ， 所 占 空间 比例 是 3/5。 

代码 第 @ 行 是 设置 第 一 列 可 以 扩展 ， 所 占 空间 比例 是 1/3 ; 代码 第 @ 行 是 设置 第 二 列 可 以 
扩展 ， 所 占 空间 比例 是 2/3 。 


19.6 ”wxPython 控件 


wxPython 的 所 有 控件 都 继承 自 wx.Control 类 ， 具 体内 容 参 考 图 19-3。 主 要 有 文本 输入 控 
件 、 按 钮 、 静 态 文本 、 列 表 、 单 选 按钮 、 滑 块 、 滚 动 条 、 复 选 框 和 树 等 控件 。 


#4 如 19.6.1 静态 文本 和 按钮 


静态 文本 和 按钮 在 前 面 示例 中 已 经 用 到 了 ， 本 节 再 深入 地 介绍 一 下 它们 。 

wxPython 中 静态 文本 类 是 wx.StaticText， 可 以 显示 文本 。wxPython 中 的 按钮 主要 有 wxButton、 
wx.BitmapButton 和 wx.ToggleButton 三 个 ，wx.Button 是 普通 按钮 ，wx.BitmapButton 是 带 有 
图 标的 按钮 ，wx.ToggleButton 是 能 进行 两 种 状态 切换 的 按钮 。 

下 面 通过 示例 介绍 静态 文本 和 按钮 。 如 图 19-16 所 示 的 界面 ， 其 中 有 一 个 静态 文本 和 
三 个 按钮 ，OK 是 普通 按钮 ，ToggleButton 是 wx.ToggleButton 按钮 ， 图 19-16 (a) 所 示 是 
ToggleButton 抬 起 状态 ， 图 19-16 (b) 所 示 是 ToggleButton 按 下 时 状态 。 最 后 一 个 是 图 标 按钮 。 


(a ) ToggleButton 抬 起 状态 (b ) ToggleButton 按 下 时 状态 
图 19-16 静态 文本 和 按钮 示例 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter19/ch19.6.1.py 


import wx 
# 自 定义 窗口 类 MyFrame 


class MyFrame (wx.Frame): 
def _init (self): 


super () . init (parent=None，title="' 静态 文本 和 按钮 '，size=(300，200) ) 
self.Centre() ## 设置 窗口 居中 
panel = wx.Panel (parent=self) 


# 创建 垂直 方向 的 Box 布局 管理 器 
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vbox = wx.BoxSizer (wx.VERTICAL) 


self.statictext = wx.StaticText (parent=panel, label='StaticTextl', 

style=wx.ALIGN CENTRE HORIZONTAL) [oO 
bl = wx.Button (parent=panel, label='OK') @ 
self.Bind (wx.EVT BUTTON, self.on click, bl1) 


b2 = wx.ToggleButton (panel, -1, 'ToggleButton') 回 
self.Bind(wx.EVT_BUTTON，self.on_click，b2) 


bmp = wx.Bitmap('"'icon/1.png', wx.BITMAP TYPE PNG) @ 
b3 = wx.BitmapButton (panel, -1, bmp) 
self.Bind (wx.EVT BUTTON, self.on click, b3) 


# 添加 静态 文本 和 按钮 到 Box 布局 管理 器 

vbox.Add(100, 10, proportion=1, flag=wx.CENTER | wx.FIXED MINSIZE) 
Vbox.Add (self.statictext, proportion=1, flag=wx.CENTER | wx.FIXED MINSIZE) 
vbox.Add(bl, proportion=]1, flag=wx.CENTER | wx.EXPAND) 

vbox.Add(b2, proportion=]1, flag=wx.CENTER | wx.EXPAND) 

vbox.Add (b3, proportion=]1, flag=wx.CENTER | wx.EXPAND) 


panel.SetSizer (vbox) 


def on click(self, event): 
self.statictext.SetLabelText ('Hello, world.') 


上 述 代码 第 四 行 是 创建 wx.StaticText 对 象 。 代 码 第 @ 行 是 创建 wx.Button 按钮 。 代 码 第 @@ 
行 是 创建 wx.ToggleButton 按钮 。 代 码 第 @ 行 是 创建 wx.Bitmap 按钮 ， 其 中 'icon/1.png' 是 图 标 
文件 路 径 ，wx.BITMAP_TYPE _PNG 是 设置 图 标 图 片 格式 类 型 。 


19.6.2 文本 输入 控件 


文本 输入 控件 类 是 wx.TextCtrl， 默 认 情况 下 文本 输入 控件 中 只 能 输入 单行 数据 ， 如 果 想 
输入 多 行 可 以 设置 style=wx.TE_MULTILINE。 如 果 想 把 文本 输入 控件 作为 密码 框 使 用 ， 可 以 
设置 style=wx.TE_PASSWORD。 

下 面 通过 示例 介绍 文本 输入 控件 。 如 图 19-17 所 示 的 界 
面 是 19.5.4 节 示 例 重 构 ， 其 中 用 户 ID 对 应 的 wx.TextCtrl 是 坟 0 
普通 文本 输入 控件 ， 密 码 对 应 的 wx.TextCtrl 是 密码 输入 控 | 罕 : Ea 

多 行文 本 


件 ， 多 行文 本 的 wx.TextCtrl 是 多 行文 本 输入 控件 。 FRR 
示例 代码 如 下 : 
# coding=utf-8 图 19-17 文本 输入 控件 示例 


# 代码 文件 ，chapter19/ch19.6.1.py 


import wx 


# 自 定义 窗口 类 MyFrame 
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class MyFrame (wx.Frame): 
def _init (self): 
super() ._ init (parent=None，title="' 静态 文本 和 按钮 '，size=(400，200)) 
self.Centre() # 设置 窗口 居中 


panel = wx.Panel (self) 

hbox = wx.BoxSizer (wx.HORIZONTAL) 

fgs = wx.FlexGridSizer(3, 2, 10, 10) 

userid = wx.StaticText (panel, label=" 用 户 ID: ") 
pwd = wx.StaticText (panel，label=" 密码: ") 
content = wx.StaticText (panel，label=" 多 行文 本 : ") 
tcl = wx.TextCtrl (panel) 


tc2 = wx.TextCtrl (panel, style=wx.TE PASSWORD) 
tc3 = wx.TextCtrl (panel, style=wx.TE MULTILINE) 


@@e 


# 设置 tcl 初始 值 

tcl.SetValue('tony') 

# 获取 tcl 值 

print (' 读 取 用 户 ID: {0}'.format(tcl.GetValue())) 


fgs.AddMany ([userid, (tcl, 1, wx.EXPAND), 
pwd, (tc2, 1, wx.EXPAND), 
content, (tc3, 1, wx.EXPAND)]) 
fgs.AddGrowableRow (0, 1) 
fgs.AddGrowableRow (1, 1) 
fgs.AddGrowableRow (2, 3) 
fgs.AddGrowableCol (0, 1) 
fgs.AddGrowableCol (1, 2) 
hbox.Add (fgs, proportion=], flag=wx.ALL | wx.EXPAND, border=15) 
panel.SetSizer (hbox) 


上 述 代 码 第 @ 行 创建 了 一 个 普通 的 文本 输入 控件 对 象 。 代 码 第 @@ 行 创建 了 一 个 密码 输入 控 
件 对 象 。 代 码 第 @@ 行 能 输入 多 行文 本 控件 对 象 。 代 码 第 田 行 tcl.SetValue('tony') 用 来 设置 文本 
输入 控件 的 文本 内 容 ，SetValue0 方法 可 以 为 文本 输入 控件 设置 文本 内 容 ，GetValue0 方法 是 
从 文本 输入 控件 中 读 取 文本 内 容 ， 见 代码 第 @ 行 。 


19.6.3” 复 选 框 和 单 选 按钮 


wxPython 中 提供 了 用 于 多 选 和 单 选 功能 的 控件 。 
多 选 控件 是 复 选 框 (wx.CheckBox)， 复 选 框 有 时 也 单独 使 用 ， 能 提供 两 种 状态 的 开 和 关 。 
单 选 控 件 是 单 选 按 钮 (wx.RadioButton)， 同 一 组 的 多 个 单 选 按钮 应 该 具有 互 斥 特 性 ， 这 也 
是 为 什么 单 选 按钮 也 称 为 收音 机 按钮 (RadioButton)， 就 是 


: DPyhon Blave DC++ 


当 一 个 按钮 按 下 时 ， 其 他 按钮 一 定 释放 。 ase: @8 Ox 


: OO OW 


下 面 通过 示例 介绍 复 选 框 和 单 选 按 钮 。 如 图 19-18 所 示 
的 界面 ， 界 面 中 有 一 组 复 选 框 和 两 组 单 选 按 钮 。 图 19-18” 复 选 框 和 单 选 按钮 示例 
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示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l9/ch19.6.3.py 


import wx 


# 自 定 义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init (self):; 
super()._init (parent=None，title=' 复 选 框 和 单 选 按钮 '"，size=(400，130)) 
self.Centre() # 设置 窗口 居中 


panel = wx.Panel (self) 
hboxl = wx.BoxSizer (wx.HORIZONTAL) 


statictext = wx.StaticText (panel，label=' 选择 你 喜欢 的 编程 语言 ，' ) 
cbl = wx.CheckBox (panel, 1, '‘'Python') 

cb2 = wx.CheckBox (panel, 2, 'Java') 

cb2.SetValue (True) 

cb3 = wx.CheckBox (panel, 3, 'C++') 

self.Bind (wx.EVT CHECKBOX, self.on checkbox click, id=1, id2=3) 


©@© © 


hboxl.Add (statictext, 1, flag=wx.LEFT | wx.RIGHT | wx.FIXED MINSIZE, border=5) 
hboxl.Add (cbl, 1, flag=wx.ALL | wx.FIXED MINSIZE) 
hboxl.Add (cb2, 1, flag=wx.ALL | wx.FIXED MINSIZE) 
hboxl.Add (cb3, 1, flag=wx.ALL | wx.FIXED MINSIZE) 


hbox2 = wx.BoxSizer (wx.HORIZONTAL) 


statictext = wx.StaticText (pane1l，1label=' 选择 性 别 : ') 


radiol = wx.RadioButton(panel, 4, ' 男 ', style=wx.RB_GROUP) © 
radio2 = wx.RadioButton(panel，5, ' 女 ') 
self.Bind (wx.EVT RADIOBUTTON, self.on radiol click, id=4, id2=5) @ 


hbox2.Add (statictext, 1, flag=wx.LEFT | wx.RIGHT | wx.FIXED MINSIZE, border=5) 
hbox2.Add (radiol, 1, flag=wx.ALL | wx.FIXED MINSIZE) 
hbox2.Add (radio2, 1, flag=wx.ALL | wx.FIXED MINSIZE) 


hbox3 = wx.BoxSizer (wx.HORIZONTAL) 


statictext = wx.StaticText (panel，label=' 选择 你 最 喜欢 吃 的 水 果 : ') 
radio3 = wx.RadioButton (panel，6，' 苹果 '，style=wx.RB_GROUP) 
radio4 = wx.RadioButton(panel，7，' 橘子 ') 
radio5 = wx.RadioButton (panel，8， ' 香 燕 ') 
self.Bind (wx.EVT RADIOBUTTON, self.on radio2 click, id=6, id2=8) 


8 


hbox3.Add (statictext, 1, flag=wx.LEFT | wx.RIGHT | wx.FIXED MINSIZE, border=5) 
hbox3.Add (radio3, 1, flag=wx.ALL | wx.FIXED MINSIZE) 
hbox3.Add (radio4, 1, flag=wx.ALL | wx.FIXED MINSIZE) 
hbox3.Add (radio5, 1, flag=wx.ALL | wx.FIXED MINSIZE) 


vbox = wx.BoxSizer (wx.VERTICAL) 
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vbox.Add (hbox1，1，flag=wx.RLL | wx.EXPRND，border=5) 
vbox.Add (hbox2，1，flag=wx.RLL | wx.EXPAND, border=5) 
vbox.Add (hbox3, 1, flag=wx.ALL | wx.EXPAND, border=5) 
panel.SetSizer (vbox) 


def on checkbox click(self, event): 
cb = event.GetEventObject () 
print (' 选择 {0}， 状态 {1}' .format (cb.GetLabel(), event.IsChecked())) 


def on radiol click(self, event): 
rb = event.GetEventObject () 
print (' 第 一 组 {0} 被 选中 ' .format (rb.GetLabel() )) 


def on radio2 click(self, event): 
rb = event.GetEventObject () 
print (' 第 二 组 {0} 被 选中 ' .format (rb.GetLabel ())) 


上 述 代 码 第 @@ 行 ~ 第 @ 行 创建 了 三 个 复 选 框 对 象 ， 代 码 第 @ 行 是 绑 定 id 从 1 到 3 所 有 控 
件 到 事件 处 理 者 self.on_checkbox_click 上 ， 类 似 的 还 有 代码 第 @ 行 和 第 @ 行 。 代 码 第 @ 行 是 


设置 cb2 的 初始 状态 为 选中 。 


代码 第 @ 行 和 第 @ 行 创建 了 两 个 单 选 按钮 ， 由 于 这 两 个 单 选 按钮 是 互 斥 的 ， 所 以 需要 把 它 
们 添加 到 一 个 组 中 。 代 码 第 @ 行 中 创建 wx.RadioButton 对 象 时 设置 style=wx.RB_GROUP， 这 
说 明 是 一 个 组 的 开始 ， 直 到 遇 到 另外 设置 style=wx.RB_GROUP 的 wx.RadioButton 对 象 为 止 都 
是 同一 个 组 。 所 以 radiol 和 radio2 是 同一 组 ，radio3、radio4 和 radio5 是 同一 组 ， 见 代码 第 @ 


行 和 第 @ 行 。 


在 事件 处 理 方法 中 ， 代 码 第 ! 行 和 第 # 行 从 事件 对 象 中 取出 事件 源 对 象 ， 代 码 第 @ 行 
event.IsChecked() 可 以 获得 状态 控件 的 选中 状态 ， 代 码 第 $ 行 Ib.GetLabel() 可 以 获得 状态 控 


件 标签 。 
19.6.4 下 拉 列 表 


下 拉 列 表 控件 是 由 一 个 文本 框 和 一 个 列表 选项 构成 的 ， 如 图 19-19 所 示 ， 选 项 列表 是 收 起 
来 的 ， 默 认 每 次 只 能 选择 其 中 的 一 项 。wxPython 提供 了 两 种 下 拉 列 表 控 件 类 wx.ComboBox 和 
wx.Choice，wx.ComboBox 默认 它 的 文本 框 是 可 以 修改 的 ，wx.Choice 是 只 读 不 可 以 修改 的 ， 


除 此 之 外 它们 没有 区 别 。 


下 面 通过 示例 介绍 下 拉 列 表 控 件 ， 如 图 19-19 所 示 的 界面 ， 界 面 中 有 两 个 下 拉 列 表 控件 ， 


上 面 的 是 wx.ComboBox， 下 面 的 是 wx.Choice。 


wx. ComboBox _ Wx. Choice 
~ AN 


memes sneses  [i 
迁 择 性 别 : 运 反 性 别 : E 3 
(a ) 下 拉 列 表示 例 1 (b ) 下 拉 列 表示 例 2 


图 19-19 下 拉 列 表示 例 
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示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 chapter1l9/ch19.6.4.py 


import wx 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _ init_ (self): 
super()._init (parent=None，title=' 下 拉 列 表 '，size=(400，130)) 
self.Centre() # 设置 窗口 居中 


panel = wx.Panel (self) 
hboxl = wx.BoxSizer (wx.HORIZONTAL) 


statictext = wx.StaticText (panel，label=' 选择 你 喜欢 的 编程 语言 ' ) 


listl = ["PYython'， "C++'， "Java'] 
chl = Wx.ComboBox (panel, -1, value='C', choices=listl, style=wx.CB_SORT) @O 
self.Bind(wx.EVT_COMBOBOX，self.on_combobox，chl) 加 


hboxl.Add (statictext, 1, flag=wx.LEFT | wx.RIGHT | wx.FIXED_ MINSIZE, border=5) 
hboxl.Add(chl, 1, flag=wx.ALL | wx.FIXED MINSIZE) 


hbox2 = wx.BoxSizer (wx.HORIZONTAL) 


statictext = wx.StaticText (panel,，label=' 选择 性 别 : ') 

10t2 mI" 昂 ";" 女 "] 

ch2 = wx.Choice(panel, -1, choices=list2) @ 
self.Bind(wx.EVT_ CHOICE, self.on choice, ch2) @ 


hbox2.Add (statictext, 1, flag=wx.LEFT | wx.RIGHT | Wx.FIXED MINSIZE, border=5) 
hbox2.Add (ch2, 1, flag=wx.ALL | wx.FIXED MINSIZE) 


Vvhox = wx.BoxSizer (wx.VERTICAL) 

vbox.Add (hboxl, 1, flag=wx.ALL | wx.EXPAND, border=5) 
vbox.Add (hbox2, 1, flag=wx.ALL | wx.EXPAND, border=5) 
panel.SetSizer (vbox) 


def on combobox (self, event): 
print(' 选择 {0}'.format (event.GetString())) 


def on choice(self, event): 
print('" 选择 {0}'.format (event.GetString())) 


上 述 代码 第 四 行 是 创建 wx.ComboBox 下 拉 列 表 对 象 ， 其 中 参数 value 用 来 设置 默认 值 ， 
即 下 拉 列 表 的 文本 框 中 初始 显示 的 内 容 choices 参数 用 来 设置 列表 选择 项 ， 它 是 列表 类 型 ; 
style 参数 用 来 设置 wx.ComboBox 风格 样式 ， 主 要 有 4 种 风格 。 
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。，wx.CB_SIMPLE: 列表 部 分 一 直 显示 不 收 起 来 。 
。wx.CB DROPDOWN : 默认 风格 ， 单 击 向 下 按钮 列表 部 分 展开 ， 如 图 19-19 (b) 所 示 ， 
选择 完成 收 起 来 ， 如 图 19-19 (a) 所 示 。 
。wx.CB READONLY: 文本 框 不 可 修改 。 
"wx.CB_SORT : 对 列表 选择 项 进行 排序 ， 本 例 中 设置 该 风格 ， 所 以 显示 的 顺序 如 
19-19 (b) 所 示 。 
代码 第 加 行 是 绑 定 wx.ComboBox 下 拉 选 择 事 件 wx.EVT_ COMBOBOX 到 self.on_ 
combobox 方法 ， 当 选择 选项 时 触发 该 事件 ， 调 用 self.on_combobox 方法 进行 事件 处 理 。 
代码 第 @ 行 是 创建 wx.Choice 下 拉 列 表 对 象 ， 其 中 choices 参数 设置 列表 选择 项 。 代 码 第 
图 行 是 绑 定 wx.Choice 下 拉 选 择 事件 wx.EVT_CHOICE 到 self.on_choice 方法 ， 当 选择 选项 时 
触发 该 事件 ， 调 用 self.on_choice 方法 进行 事件 处 理 。 


19.6.5 列表 


列表 控件 类 似 于 下 拉 列 表 控 件 ， 只 是 没有 文本 框 ， 只 
有 一 个 列表 选项 ， 如 图 19-20 所 示 ， 列 表 控 件 可 以 单 选 或 多 
选 。 列 表 控 件 类 是 wx.ListBox。 

下 面 通过 示例 介绍 列表 控件 。 如 图 19-20 所 示 的 界面 ， 
界面 中 有 两 个 列表 控件 ， 上 面 的 列表 控件 是 单 选 ， 而 下 面 
的 列表 控件 是 可 以 多 选 的 。 图 19-20 列表 示例 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter1l9/ch19.6.5.py 


import wx 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init_ (self): 
super ()._init (parent=None，title=' 下 拉 列 表 '，size=(350，180)) 
self.Centre() # 设置 窗口 居中 


Panel = wx.Panel (self) 

hboxl = wx.BoxSizer (wx.HORIZONTAL) 

statictext = wx.StaticText (panel，label=' 选择 你 喜欢 的 编程 语言 ' ) 
listl = ['Python', 'C++', 'Java'] 


lbl = wx.ListBox(panel, -1, choices=listl, style=wx.LB_ SINGLE) 
self.Bind (wx.EVT LISTBOX, self.on listboxl, 1b1) 


@ 
© 


hbox1 .Add (statictext, 1, flag=wx.LEFT | Wwx.RIGHT | wx.FIXED MINSIZE, border=5) 
hboxl1.Add (lbl, 1, flag=wx.ALL | wx.FIXED MINSIZE) 
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hbox2 = wx.BoxSizer (wx.HORIZONTAL) 


statictext = wx.StaticText (panel，label=' 选择 你 喜欢 吃 的 水 果 : ') 

list2 = 【" 苹果 "，“" 橘子 "，“' 香 燕 '] 

lb2 = Wwx.ListBox(panel, -1, choices=list2, style=wx.LB EXTENDED) @ 
self.Bind (wx.EVT LISTBOX, self.on listbox2, 1b2) @ 


hbox2.Add (statictext, 1, flag=wx.LEFT | wx.RIGHT | wx.FIXED MINSIZE, border=5) 
hbox2.Add (lb2, 1, flag=wx.ALL | wx.FIXED MINSIZE) 


Vbox = Wwx.BoxSizer (wx.VERTICAL) 
vbox.Add (hboxl, 1, flag=wx.ALL | wx.EXPAND, border=5) 
Vbox.RAdd (hbox2, 1, flag=wx.ALL | wx.EXPAND, border=5) 


panel.SetSizer (vbox) 


def on listboxl (self, event): 


listbox = event.GetEventObject () © 

print (' 选择 {0}'.format (listbox.GetSelection())) 
def on listbox2 (self, event): 

listbhox = event.GetEventObject () 

print(' 选择 {0}'.format (listbox.GetSelections())) @ 


上 述 代码 第 @ 行 是 创建 wx.ListBox 列表 对 象 ， 其 中 参数 style 用 来 设置 列表 风格 样式 ， 常 
用 的 有 4 种 风格 。 

。wx.LB_SINGLE: 单 选 。 

。Wx.LB_MULTIPLE: 多 选 。 

。，wx.LB_EXTENDED: 也 是 多 选 ， 但 是 需要 按 住 Ctrl 或 Shift 键 时 选择 项 目 。 

。wx.LB_SORT: 对 列表 选择 项 进行 排序 。 

代码 第 @ 行 是 绑 定 wx.ListBox 选择 事件 wx.EVT_LISTBOX 到 self.on_listbox1 方法 ， 当 
选择 选项 时 触发 该 事件 ， 调 用 self.on_listbox1 方法 进行 事件 处 理 。 

代码 第 @ 行 是 创建 wx.ListBox 列表 对 象 ， 其 中 style 参数 设置 为 wx.LB_EXTENDED, 表 
明 该 列表 对 象 可 以 多 选 。 代 码 第 @ 行 是 绑 定 wx.ListBox 选择 事件 wx.EVT_LISTBOX 到 self. 
on_listbox2 方法 。 

在 事件 处 理 方法 中 要 获得 事件 源 可 以 通过 event.GetEventObject() 方法 实现 ， 见 代码 第 @@ 
行 。 代 码 第 @ 行 的 listbox.GetSelection() 方法 返回 选中 项 目的 索引 ， 对 于 多 选 可 以 通过 listbox. 
GetSelections() 方法 返回 多 个 选中 项 目 索引 的 列表 。 


19.6.6 ”静态 图 片 控件 


静态 图 片 控 件 类 是 wx.StaticBitmap， 静 态 图 片 控 件 用 来 显示 一 张 图 片 ， 图 片 可 以 是 
wx.Python 所 支持 的 任何 图 片 格式 。 

下 面 通过 示例 介绍 静态 图 片 控 件 。 如 图 19-21 所 示 的 界面 ， 界 面 刚 显示 时 加 载 默 认 图 片 ， 
如 图 19-21 (a) 所 示 ; 当 用 户 单 击 Buttonl 时 显示 如 图 19-21 (c) 所 示 ; 当 用 户 单 击 Button2 
时 显示 如 图 19-21 (b) 所 示 。 
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(a ) 默认 图 片 (b ) 单 击 Button2 时 (e ) 单 击 Buttonl 时 
图 19-21 静态 图 片 控件 示例 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapterl9/ch19.6.6.py 


import wx 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init_ (self): 
super () ._init (parent=None，title=' 静态 图 片 控件 '，size=(300，300)) 
self.bmps = [wx.Bitmap('images/bird5.gif', wx.BITMAP TYPE GIF), 
wx.Bitmap('images/bird4.gif', wx.BITMAP TYPE GIF), 
wx.Bitmap('images/bird3.gif', wx.BITMAP _ TYPE GIF)] 


self.Centre() # 设置 窗口 居中 
self.panel = wx.Panel (parent=self) 

# 创建 垂直 方向 的 Box 布局 管理 器 

Vbox = Wx.BoxSizer (wx.VERTICAL) 


bl = wx.Button (parent=self.panel, id=1, label='Buttonl') 
b2 = wx.Button(self.panel, id=2, label='Button2') 
self.Bind (wx.EVT BUTTON, self.on click, id=1, id2=2) 


self.image = wx.StaticBitmap (self.panel, -1, self.bmps[0]) 


# 添加 标 控件 到 Box 布局 管理 器 

vbox.Add (bl, proportion=1, flag=wx.CENTER | wx.EXPAND) 
vbox.Add (b2, proportion=1, flag=wx.CENTER | wx.EXPAND) 
vbox.Add (self.image, proportion=3, flag=wx.CENTER) 


self.panel.SetSizer (vbox) 


def on click(self, event): 
event id = event.GetId() 
if event id == 1: 


self.image.SetBitmap (self.bmps[1]) 
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else: 


self.image.SetBitmap (self.bmps[2]) 


@ 四 


self.panel.Layout () 


上 述 代码 第 四 行 创建 了 wx.Bitmap 图 片 对 象 的 列表 。 代 码 第 @ 行 创建 了 一 个 面板 ， 它 是 类 
成 员 实例 变量 。 代 码 第 @ 行 wx.StaticBitmap 是 静态 图 片 控件 对 象 ，selfbmps[0] 是 静态 图 片 控 
件 要 显示 的 图 片 对 象 。 

单 击 Buttonl 和 Button2 时 都 会 调用 on_click 方法 ， 代 码 第 @ 行 和 第 @ 行 是 使 用 SetBitmap0 
方法 重新 设置 图 片 ， 实 现 图 片 切换 。 静 态 图 片 控件 在 切换 图 片 时 需要 重新 设置 布局 。 


提示 : 图 片 替换 后 ， 需 要 重新 绘制 窗口 ， 否 则 布局 会 发 生 混乱 。 代 码 第 @) 行 self.panel. 
Layout() 是 重新 设置 panel 面板 布局 ， 因 为 静态 图 片 控件 是 添加 在 panel 面板 上 的 。 


19.7 高 级 窗口 
除了 基础 控件 外 ， 还 有 一 些 重要 的 高 级 控件 和 窗口 需要 灼 悉 。 本 节 介绍 分 隔 窗口 、 树 和 网 格 。 国 By 灌 辐 


19.7.1 分隔 窗口 


要 
分 隔 窗口 (wx.SplitterWindow) 就 是 将 窗口 分 成 两 部 分 ， 即 左右 或 上 下 两 部 分 。 如 图 
19-22 所 示 窗 口 ， 整 体 上 分 为 左右 两 个 窗口 ， 右 窗口 又 分 为 上 下 两 窗口 ， 两 个 窗口 之 间 的 分 隔 
线 是 可 以 拖 忠 的 ， 称 为 “ 窗 框 ”(sash) 。 


码 看 视频 


Welcome to yhon 401 个 


窗 框 位 置 
图 19-22 分 隔 窗 口 


wx.SplitterWindow 中 一 些 常用 的 方法 有 以 下 几 种 。 

SplitVertically(window1, window2, sashPosition=0): 设置 左右 布局 的 分 隔 窗 口 ， 

window1 为 左 窗 口 ，window2 为 右 窗口 ，sashPosition 是 窗 框 的 位 置 。 

。SplitHorizontally(window1, window2, sashPosition=0) : 设置 上 下 布局 的 分 隔 窗 口 ， 
window1l 为 上 窗口 ，window2 为 下 窗口 ，sashPosition 是 窗 框 的 位 置 。 
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。，SetMinimumPaneSize(paneSize) : 设置 最 小 窗口 尺寸 ， 如 果 是 左右 布局 是 指 左 窗口 的 最 
小 尺寸 ， 如 果 是 上 下 布局 是 指 上 窗口 的 最 小 尺寸 ， 如 果 没 有 设置 则 默认 为 0。 


下 面 通 过 示例 介绍 分 隔 窗口 控件 。 如 图 19-23 所 示 的 界面 ， 
界面 分 左右 两 部 分 ， 左 边 有 列表 控件 ， 选 中 列表 项 目 时 右边 会 显 
示 相 应 的 文字 。 | 

示例 代码 如 下 : 


# coding=utf-8 


# 代码 文件 ， chapter1l9/ch19.7.1.py 


import wx 


# 自 定义 窗口 类 MyFrame 


class MyFrame (wx.Frame): 


def 


def 


init_ (self): 
super ()._init (parent=None，title=' 分 隔 窗 口 '，size=(350，180) ) 
self.Centre() # 设置 窗口 居中 


splitter = wx.SplitterWindow (self, -1) 

leftpanel = wx.Panel (splitter) 

rightpanel = wx.Panel (splitter) 
splitter.SplitVertically (leftpanel, rightpanel, 100) 
splitter.SetMinimumPaneSize (80) 


list2 = [' 苹果 '"， "橘子 "，' 香 燕 '] 
lb2 = wx.ListBox(leftpanel, -1, choices=list2, style=wx.LB_ SINGLE) 
self.Bind (wx.EVT LISTBOX, self.on listbox, 1b2) 


Vboxl = Wwx.BoxSizer (wx.VERTICAL) 
vboxl.Add (lb2, 1, flag=wx.ALL | wx.EXPAND, border=5) 
leftpanel.SetSizer (vboxl1) 


Vbox2 = Wwx.BoxSizer (wx.VERTICAL) 

self.content = wx.StaticText (rightpane1l，1abel=' 右 侧面 板 ') 
vbox2.Add (self.content, 1, flag=wx.ALL | wx.EXPAND, border=5) 
rightpanel .SetSizer (vbox2) 


on_listbox(self, event): 
s = “选择 {0}'.format (event.GetString()) 
self.content.SetLabel(s) 


图 19-23 分隔 窗口 示例 


@eeee 


上 述 代 码 第 @@ 行 是 创建 分 隔 窗 口 ， 代 码 第 @@ 行 是 创建 左面 板 ， 代 码 第 @ 行 是 创建 右面 板 。 
代码 第 图 行 splitter.SplitVertically(leftpanel, rightpanel, 100) 设置 左右 布局 的 分 隔 窗 口 ， 并 设置 
窗 框 的 位 置 为 100。 代 码 第 @ 行 设置 最 小 面板 为 80， 所 以 当 向 左 拖 忠 窗 框 时 ， 左 面板 宽度 等 于 
80 像素 时 不 能 再 拖 忠 了 。 后 面 的 代码 是 分 别 向 左右 面板 中 添加 控件 处 理 ， 这 里 不 再 装 述 了 。 


9:7.2 


使 用 树 


树 (tree) 是 一 种 通过 层次 结构 展示 信息 的 控件 ， 如 图 19-24 所 示 是 树 控件 示例 ， 左 窗口 中 
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是 树 控件 ， 在 wxPython 中 树 控件 类 是 wx.TreeCtrl。 
wx.TreeCtrl 中 一 些 常 用 的 方法 有 以 下 几 种 。 

。 AddRoot(text, image=-1, selIlmage=-1, data=None) : 添加 根 节点 ，text 参数 是 根 节 点 显 
示 的 文本 ; image 参数 是 该 节点 未 被 选中 时 的 图 片 索 引 ，wx.TreeCtrl 中 使 用 的 图 片 被 放 
到 wx.ImageList 图 像 列 表 中 ; selImage 参数 是 该 节点 被 选中 时 的 图 片 索引 ; data 参数 是 
给 节点 传递 的 数据 ; 方法 返回 节点 ， 节 点 类 型 是 wx.TreeItemId。 

AppendItem(parent, text, image=-1, selImage=-1, data=None) : 添加 子 节点 ，parent 参数 
是 父 节点 ， 其 他 参数 同 AddRoot() 方法 ， 方 法 返回 值 wx.TreeItemId。 

SelectItem(item, select=True): 选中 item 节点 ， 如 图 19-24 所 示 的 TreeRoot 节点 被 选中 。 
Expand(item): 展开 item 节点 ， 如 图 19-24 所 示 ，Item 1 和 Item 4 节点 处 于 展开 状态 。 
ExpandAll(): 展开 根 节点 下 的 所 有 子 节点 。 

ExpandAllChildren(item): 展开 item 节点 下 的 所 有 子 节点 。 

AssignImageList(imageList) : 保存 wx.ImageList 图 像 列 表 到 树 中 ， 这 样 就 可 以 在 
AddRoot() 和 AppendItem() 方法 中 使 用 图 像 列 表 索 引 了 。 

下 面 通过 示例 介绍 树 控件 。 如 图 19-24 所 示 的 一 一 一 
界面 ， 左 窗口 中 有 一 个 树 控件 ， 当 单 击 树 中 节点 | Be 
时 ， 右 窗口 显示 单 击 的 节点 文本 内 容 。 Fe 

示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapterl9/ch19.7.2.py 


import wx 


# 自 定义 窗口 类 MYyFrame 
class MyFrame (wx.Frame): 图 19-24 树 控件 示例 
def _ init_ (self): 
super() ._init (parent=None，title=' 树 控件 '，size=(500，400)) 
self.Centre() # 设置 窗口 居中 


splitter = wx.SplitterWindow (self) 

leftpanel = wx.Panel (splitter) 

rightpanel = wx.Panel (splitter) 
splitter.SplitVertically (leftpanel, rightpanel, 200) 
splitter.SetMinimumPpaneSize (80) 


self.tree = self.CreateTreeCtr]l (leftpanel) 
self.Bind (wx.EVT TREE SEL CHANGING, self.on click , self.tree) 
vboxl = wx.BoxSizer (wx.VERTICAL) 

vboxl.Add (self.tree, 1, flag=wx.ALL | wx.EXPAND, border=5) 


©o 


leftpanel.SetSizer (vbox1) 


vbox2 = Wwx.BoxSizer (wx.VERTICAL) 

self.content = wx.StaticText (rightpane1l，1label=' 右 侧 面板 ') 
vbox2.Add (self.content, 1, flag=wx.ALL | wx.EXPAND, border=5) 
rightpanel .SetSizer (vbox2) 
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def on click(self, event): 
item = event.GetItem() 


self.content.SetLabel (self.tree.GetItemText (item)) 


def CreateTreeCtrl (self, parent): 


@@ Ee 


tree = wx.TreeCtr]l (parent) 
items = [] 
imglist = wx.ImageList(16, 16, True, 2) 


imglist.Add (wx.ArtProvider.GetBitmap (wx.ART FOLDER, size=wx.Size(16, 16))) 
imglist.Add (wx.ArtProvider.GetBitmap (wx.ART NORMAL FILE, size=wx.Size 


因 @ 


(16, 16))) 


ee 


tree.AssignImageList (imglist) 


root = tree.AddRoot ("TreeRoot", image=0) 


items.append (tree.AppendItem(root, "Item 1", 0)) @ 
items .append (tree.AppendItem(root, "Item 2", 0)) 
items .append (tree.AppendItem(root, "Item 3", 0)) 
items.append (tree.AppendItem(root, "Item 4", 0)) 
items .append (tree.AppendItem(root, "Item 5", 0)) # 


for ii in range(len(items)): 
id = items[ii] 
tree.AppendItem(id, "Subitem 1", 1) $ 


tree.AppendItem(id, "Subitem 2", 1) 
tree.AppendItem(id, "Subitem 3", 1) 
tree.AppendItem(id, "Subitem 4", 1) 
tree.AppendItem(id, "Subitem 5", 1) % 


tree.Expand (root) # 展开 根 下 子 节点 

tree.Expand (items [0]) # 展开 Item 1 下子 节点 
tree.Expand (items [3]) # 展开 Item 4 下子 节点 
tree.SelectItem (root) # 选中 根 节点 tree.Expand (root) 


return tree 


上 述 代码 第 Q@ 行 调用 了 self.CreateTreeCtrl(leftpanel) 方法 创建 树 对 象 ， 代 码 第 @ 行 定义 了 
CreateTreeCtrl0 方法 创建 树 对 象 ， 返 回 值 是 树 对 象 ， 代 码 第 @ 行 是 创建 树 对 象 。 代 码 第 @ 行 是 
创建 wx.ImageList 图 像 列 表 ， 构 造 方 法 定义 如 下 : 


wx.ImageList (width, height, mask=True, initialCount=1) 


其 中 width 是 图 像 宽度 ，height 是 图 像 高 度 ，mask 是 设置 图 像 掩 膜 ”，initialCount 是 设置 列表 
容量 。 


四 掩 膜 是 一 种 图 像 滤 镜 的 模板 ， 在 掩 膜 计算 时 ， 原 始 图 像 矩阵 与 掩 膜 矩阵 进行 运算 ， 获 得 一 个 新 的 图 像 。 
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代码 第 @ 行 和 第 @ 行 是 添加 图 像 对 象 元 素 到 图 像 列表 中 ， 使 用 了 wx.ArtProvider. 
GetBitmap0 方法 创建 图 像 对 象 。wx.ART FOLDER 和 wx.ART _ NORMAL FILE 是 wxPython 
内 置 的 图 片 14，wx.ART_FOLDER 表示 文件 夹 图 标 ，wx.ART_NORMAL FILE 表示 文件 图 标 
( 见 图 19-24) 。 创 建 的 图 像 列表 imglist 要 通过 tree.AssignImageList(imglist) 方法 添加 到 树 对 象 
中 ， 见 代码 第 @ 行 。 

代码 第 ! 行 添加 了 根 节点 ，image 是 图 像 在 图 像 列 表 imglist 中 的 索引 。 代 码 第 @ 行 和 第 
# 行 创建 了 5 个子 节点 ， 并 且 将 节点 添加 到 items 列表 中 。 代 码 第 $ 行 和 第 % 行 是 循环 创建 
孙 节 点 。 

代码 第 @ 行 是 绑 定 树 节点 改变 事件 wx.EVT_TREE_SEL CHANGING 到 selfon_click 方 
法 上 ， 在 self.on_click 方 法 中 ， 代 码 第 @ 行 是 获得 选择 的 节点 对 象 ， 代 码 第 @ 行 self tree. 
GetItemText(item) 取出 节点 的 文本 。 


19.7.3 ”使 用 网 格 


当 有 大 量 数据 需要 展示 时 ， 可 以 使 用 网 格 。wxPython 的 网 格 类 似 于 Excel 电子 表格 ， 如 
图 19-25 所 示 ， 由 行 和 列 构成 ， 行 和 列 都 有 标题 ， 也 可 以 自 定义 行 和 列 的 标题 ， 而 且 不 仅 可 以 
读 取 单元 格 数据 ， 还 可 以 修改 单元 格 数据 。wxPython 网 格 类 是 wx.grid.Grid。 

下 面 通过 示例 介绍 网 格 的 使 用 。 网 格 的 行 和 列 都 被 选中 的 这 个 过 程 可 以 触发 事件 ， 示 例如 
图 19-26 所 示 ， 网 格 行 被 选中 。 


1 Ps Jases 生 牙 。 人 民 闻 志 扩 福 20000812 1 Er 出 版 社 2000 
2 0004 |RASHIIE。。。 允 尊 中国 办 Rd 版 导 19990312 |2 5 hi 19990312 |2 
3 “0026 “| 钦 件 I 得 中 国 。 经济 科学 凡 娥 社 20000328 |4 和 4 国 全 科学 册 版 导 20000328 /4 
4 oo5 “| 人 Te 出 WRITE 19091223 3 册 丰 “WRITE 入 19091223 |3 
5 0037 南方 大 未 站 光明 卫 方 出 藉 社 20000923 3 次 方 周 未 逆光 表亲 方 出 版 社 20000923 3 
5 0000 KS3 外 于。 19990723 |2 ES3 0 HE 19990723 |2 
了 0019 | 通 入 与 风 阁 。。 B38 机 机 本 Tt 用 20000517 |1 油 肌 5 网 阁 。。@ 扫 者 机柜 工 业 岂 及 福 “20000517 |1 
0014 期 分 析 HE "Sart 19991122 3 分析 HE Yat 19991122 3 
9 0023 “| GE 野生 。 北京 大 学 呈 注 20000819 3 FE BE 20000819 |3 
| 10 007 |i 二。 骨 家 TW 20000218 |4 计 基 机 于 天 丰 。 山 家 。 机柜 工业 20000218 |4 
1 0002 “| 大 19080318 |2 E Pe RA 19980318 2 
12 0033 代 凡 电路 Mg 苞 才 电子 工业 出 版 社 20000527 2 12 0033 代入 电路 允 芝 才 电子 TWht 20000527 |2 
位 。 0011 | 三 5 了 两广 d 版 导 。 19990930 2 但。 0011 本 方 E 本 两 方 册 电 让 19990930 |2 
1 oo | 梧 PR ent 20000508 |14 0 P20000508 |14 
二 0001 | 多 HI 得 WE YT 19980528 [2 号 0001 的 HI@ WB WRT 19980528 2 
16 oo 天 部委 好 省 李 云 。 人 民 地 电 出 版 社 20000630 |1 16 0034 生 汪 要 果 省 季 云 。 人 民 弛 电 出 版 社 20000630 1 
条 |0031 ex#IB MS 电子 dt 20000324 3 条 0031 ef#IBE MS 了 TWN 20000324 3 
18 |0030 数 所 李 及 应 用 孙 家 等 清华 大 学 出 版 社 20000619 1 18 0030 数据 芝 及 应 用 孙 家 著 清华 大 学 出 版 福 20000619 1 
> 39 0024 | 如 沪 科 学 手 六 本 沪 学 :IE 村 20000923 2 | 
图 19-25 ”网 格 示例 图 19-26 选中 网 格 行 示例 
有 具体 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter19/ch19.7.3-1.py 


import wx 


import wx.grid 


data = [['"0036'， ' 高 等 数学 '，' 李 放 '，' 人 民 邮 电 出 版 社 "'， "20000812'， "1 
["0004'， "FLRSH 精 选 ，，' 刘 扬 '，“' 中 国 纺织 出 版 社 "'， "19990312'， 
"0026'，“' 软件 工程 '，' 牛 田 '，，' 经 济 科 学 出 版 社 "'， "20000328'， "4" 


Pe 
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['"0015'， ' 人 工 智能 '，' 周末 '，“' 机 械 工业 出 版 社 "， "19991223'"， 


0] 


413， 


column_names = [' 书籍 编号 '，' 书籍 名 称 '，“"' 作者 "，“" 出 版 社 "，“ 出 版 日 期 '， 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init (self): 


m 


m 


super()._init (parent=None，title=' 网 格 控 件 '，size=(550, 


self.Centre() # 设置 窗口 居中 
self.grid = self.CreateGrid(self) 


self.Bind (wx.grid.EVT GRID LABEL LEFT CLICK, self.OnLabelLeftClick) 


OnLabelLeftClick(self, event): 

print ("RowIdx: {0}".format (event.GetRow())) 
print ("ColIdx: {0}".format (event.GetCol ())) 
print (data[event.GetRow()]) 

event .Skip () 


CreateGrid(self，Parent) : 
grid = wx.grid.Grid(parent) 
grid.CreateGrid(len(data), len(data[0])) 


for row in range(len(data) ) : 
for col in range(len(data[row])): 
grid.SetColLabelValue (co1，column_names [col]) 
grid.SetCellValue (row，col，data[row] [col]) 


# 设置 行 和 列 自 定 调整 
grid.AutoSize() 


return grid 


]， 


" 库存 数量 ' ] 


500)) 


@@e 四 ©o 


©@© 9 


上 述 代 码 第 @ 行 调用 了 self.CreateGrid(self) 方 法 创建 网 格 对 象 ， 代 码 第 @ 行 定义 了 
CreateGrid() 方法 ; 代码 第 回 行 创建 了 网 格 对 象 ; 代码 第 @ 行 CreateGrid() 方法 是 设置 网 格 行 数 
和 列 数 ， 此 时 的 网 格 是 没有 内 容 的 ;代码 第 @ 行 ~ 第 @ 行 通过 双 层 嵌 套 循环 设置 每 一 个 单元 格 
的 内 容 ， 其 中 SetCellValue0 方法 可 以 设置 单元 格 内 容 ; 另外 ， 代 码 第 @ 行 SetColLabelValue() 
方法 是 设置 列 标题 。 

代码 第 @@ 行 是 绑 定 网 格 的 鼠标 左 键 单 击 行 或 列 标题 事件 。 在 事件 处 理 方 法 self. 
OnLabelLeftClick 中 ， 代 码 第 @ 行 data[event.GetRow()] 是 获取 行 数据 ， 事 件 源 的 GetRow() 方 
法 获得 选中 行 索引 ， 事 件 源 的 GetCol0 方法 获得 选中 列 索引 。 另 外 ， 在 事件 处 理 方法 最 后 一 行 
是 event.Skip0 语句 ， 该 语句 可 以 确保 继续 处 理 其 他 事件 。 

本 例 中 添加 单元 格 数据 比较 麻烦 ， 而 且 对 于 网 格 的 控制 也 很 少 ， 为 此 可 以 使 用 wx.grid. 
GridTableBase 类 ， 该 类 是 一 个 抽象 类 ， 开 发 人 员 需 要 实现 该 类 一 些 方法 。 重 构 上 面 的 示例 


代码 如 下 : 
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# coding=utf-8 
# 代码 文件 ， chapter1l9/ch19.7.3-2.py 


import wx 


import wx.grid 


data = [['0036'，,，' 高 等 数学 '，“' 李 放 '，' 人 民 邮 电 出 版 社 '"，"'20000812'，'1']， 
["'0004'，'FLASH 精 选 "'，' 刘 扬 ，，，' 中 国 纺织 出 版 社 '，'19990312'，'2'] 
['"0026'， ' 软件 工程 '，' 牛 田 '，' 经 济 科学 出 版 社 '，"'20000328'，'4']， 
['"0015'，' 人 工 智能 '，“' 周末 '，“' 机 械 工 业 出 版 社 '，"'19991223'，'3']， 
gg 


column_names = [' 书籍 编号 '，' 书籍 名 称 书籍 名 称 '，“' 作者 '，“' 出 版 社 '，' 出 版 日 期 '， 


class MyGridTable (wx.grid.GridTableBase): 
def _init (self): 
super()._init _() 
self.colLabels = column names 


def GetNumberRows (self): 
return len(data) 


def GetNumberCols (self): 
return len(data[0]) 


def GetValue (self, row, col): 
return data [row] [col] 


def GetColLabelValue (self, col): 
return self.colLabels[col] 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _ init_ (self): 
super()._init (parent=None，title=' 网 格 控 件 '，size=(550，500)) 
self.Centre () # 设置 窗口 居中 
self.grid = self.CreateGrid(self) 


" 库存 数量 '] 


@ 
@ 


self.Bind (wx.grid.EVT GRID LABEL LEFT _ CLICK, self.OnLabelLeftClick) 


def OnLabelLeftClick(self, event): 
print ("RowIdx: {0}".format (event.GetRow())) 
print ("ColIdx: {0}".format (event.Getcol())) 
print (data[event.GetRow()]) 
event .Skip () 


def CreateGrid(self, parent): 
grid = wx.grid.Grid (parent) 
table = MyGridTable() 
grid.SsetTable (table, True) 


©@@Q 
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# 设置 行 和 列 自 定 调整 


grid.Autosize() 


return grid 


上 述 代码 @ 行 是 自 定义 wx.grid.GridTableBase 类 。 代 码 第 @@ 行 是 定义 构造 方法 ， 在 此 方 
法 中 可 以 进行 表格 初始 化 设置 。 代 码 第 @ 行 使 用 GetNumberRows( 方法 ， 返 回 网 格 行 数 。 代 
码 第 四 行使 用 GetNumberCols() 方法 ， 返 回 网 格 列 数 。 代 码 第 @ 行 使 用 GetValue (方法 ， 返 
回 单元 格 内 容 。 代 码 第 @ 行 使 用 GetColLabelValue() 方法 ， 返 回 列 标题 ， 该 方法 可 以 设置 列 标 
题 。 如 果 想 设置 行 标题 可 以 使 用 GetRowLabelValue(self row) 方法 。 

代码 第 @ 行 是 创建 网 格 对 象 ， 代 码 第 @ 行 是 创建 自 定义 的 MyGridTable 对 象 ， 代 码 第 @ 行 
grid.SetTable(table, True) 是 将 MyGridTable 对 象 添加 到 网 格 对 象 中 ， 第 二 个 参数 True 表示 当 
网 格 对 象 内 存 被 回收 时 ，MyGridTable 对 象 也 会 被 清除 。 


19.8 使 用 菜单 


在 图 形 用 户 界面 中 菜单 是 不 可 或 缺 的 元 素 之 一 ， 菜 单 的 构成 如 图 19-27 所 示 ， 包 括 菜 
单 栏 (wx.MenuBar)、 菜 单 (wx.Menu) 和 菜单 项 (wx.MenuItem) 。 菜 单 栏 一 般 位 于 顶级 窗 
i 口 的 标题 栏 下 方 ， 以 显示 菜单 。 此 外 还 有 弹出 菜单 等 形式 。 菜 单 栏 中 包含 若干 菜单 ， 如 图 


19-27 所 示 的 “文件 ”和 “编辑 "， 注 意 “编辑 ”不 是 菜单 项 ， 而 是 菜单 ， 它 是 “文件 ”菜单 
的 子 菜单 ， 因 为 “编辑 ”菜单 还 有 下 一 级 内 容 。 菜 单 中 包含 若干 菜单 项 ， 如 图 19-27 所 示 的 
“新 建 "， 以 及 “编辑 ”菜单 下 的 “复制 ”“ 剪 切 ” 和 “粘贴 >， 菜 单项 没有 下 一 级 内 容 ， 单 击 


菜单 项 触发 事件 处 理 。 

菜单 栏 不 添加 到 父 窗口 中 ， 需 要 在 顶级 窗口 
中 通过 SetMenuBar(menuBar) 方法 添加 菜单 栏 。 
菜单 栏 (wx.MenuBar) 通过 Append(menu, title) 
方法 将 菜单 添加 到 菜单 栏 中 ， 其 中 menu 是 菜单 
对 象 ，title 是 菜单 上 文本 。 菜 单 对 象 (wx.Menu) 
通过 Append(menultem) 方法 将 菜单 项 添加 到 菜 
单 中 。 

下 面 介绍 图 19-27 所 示 菜 单 的 实现 ， 代 码 如 下 : 

# coding=utf-8 

# 代码 文件 : chapter1l9/ch19.8.py 


import wx 


import wx.grid 


# 自 定义 窗口 类 MyFrame 
class MyFrame (wx.Frame): 
def _init (self): 


， 菜单 栏 


图 19-27 菜单 构成 


super () . init (parent=None，title="' 使 用 菜单 '，size=(550，500) ) 


NORMAL) 


NORMAL) 


def 


def 
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self.Centre() # 设置 窗口 居中 

self.text = wX-TextCtrl(self，-1，style=wx.EXPRND | wx.TE MULTILINE) 
vbox = wx.BoxSizer (wx.VERTICAL) 
vbox.Add (self.text, proportion=1, flag=wx.EXPAND | wx.ALL, border=1) 
self.SetSizer (vbox) 


menubar = Wwx.MenuBar () 


© © 


file menu = wx.Menu() 
new_item = Wwx.MenuItem (file menu, wx.ID_NEW, text=" 新 建 "，kind=wx.ITEM 


四 
self.Bind (wx.EVT MENU, self.on newitem click, id=wx.ID NEW) @ 
五 le_menu.RAPpend (new_item) © 
file _ menu.AppendSeparator () 
edit menu = wx.Menu() @ 
copy_item = wx.MenuItem(edit menu, 100，text=" 复制 "，kind=wx.ITEM_ 
edit menu.Append (copy_item) 


cut_item = wx.MenuItem(edit menu, 101，text=" 剪 切 "，kind=wx.ITEM NORMAL) 
edit menu.Append(cut_ item) 


paste_item = wx.MenuItem(edit menu，102，text=" 粘贴 "，kind=wx.ITEM NORMRL) 
edit menu.Append (Paste_item) 


self.Bind (wx.EVT MENU, self.on editmenu click, id=100, id2=102) [mo] 


file_menu.Append (wx.ID_ANY, "编辑 "，edit_menu) ! 


menubar.Append (file_menu， ' 文件 ') @ 
self.SetMenuBar (menubar) ## 
on_ newitem click(self, event): 


self.text.SetLabel (' 单 击 【 新 建 】 菜单 ') 


on editmenu click(self, event): 
event_id = event.GetId() 
if event_id == 100: 
self.text.SetLabel(' 单 击 【 复 制 菜单 ') 
elif event id 101: 
self.text.SetLabel(' 单 击 【 剪 切 】 菜单 ') 
else: 


self.text.SetLabel (' 单 击 【 粘 贴 】 菜单 ') 


上 述 代码 第 @ 行 创建 了 菜单 栏 对 象 。 代 码 第 @ 行 创建 了 “文件 ”菜单 对 象 。 代 码 第 @ 行 创 
建 了 “新 建 ”菜单 项 对 象 ， 其 中 wx.ID_NEW 是 设置 菜单 项 id，wx.ID_NEW 是 wxPython 内 
置 id， 表 示 这 是 一 个 新 建 菜单 项 目 ，kind 是 菜单 项 类 型 ， 菜 单项 类 型 主要 有 如 下 5 种 。 

。wx.ITEM_SEPARATOR: 分 隔 线 菜单 项 。 
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。wx.ITEM_NORMAL: 普通 菜单 项 。 

。wx.ITEM_CHECK: 复 选 框 形式 的 菜单 项 。 

。，wx.ITEM_RADIO: 单 选 按钮 形式 的 菜单 项 。 

。wx.ITEM_DROPDOWN: 下 拉 列 表 形 式 的 菜单 项 。 

代码 第 @ 行 是 绑 定 新 建 菜单 项 的 事件 处 理 。 代 码 第 @ 行 添加 新 建 菜单 项 到 文件 菜单 。 代 码 
第 @ 行 是 添加 分 隔 线 菜单 项 ， 相 当 于 wx.ITEM_SEPARATOR 类 型 的 菜单 项 。 

代码 第 @ 行 是 创建 编辑 菜单 ， 代 码 第 @ 行 是 复制 菜单 项 ， 代 码 第 @ 行 是 将 复制 菜单 项 添加 
到 编辑 菜单 。 代 码 第 @ 行 是 将 复制 、 剪 切 和 粘贴 三 个 菜单 项 的 事件 处 理 绑 定 到 一 个 方法 。 代 码 
第 ! 行 是 将 编辑 菜单 添加 到 文件 菜单 中 。 

代码 第 @ 行 是 将 文件 菜单 添加 到 菜单 栏 中 ， 代 码 第 # 行 是 将 菜单 栏 添加 到 当前 顶级 窗口 。 


19.9 使 用 工具 栏 


在 图 形 用 户 界 面 中 ， 工 具 栏 也 是 不 可 或 缺 的 元 素 之 一 。 工 具 栏 包括 文本 或 图 标 按钮 构成 的 
按钮 集合 ， 通 常 置 于 顶级 窗口 菜单 栏 之 下 。wxPython 中 工具 栏 类 是 wx.Toolbar。 
顶级 窗口 都 有 一 个 ToolBar 属性 可 以 设置 它 的 工具 栏 ， 然 后 通过 工具 栏 的 AddTool0 方法 
添加 按钮 到 工具 栏 ， 最 后 调用 工具 栏 的 Realize() 确定 。 
下 面 通过 示例 介绍 工具 栏 的 使 用 。 如 图 e 
19-28 所 示 的 界面 ， 在 顶级 窗口 中 有 菜单 栏 和 工 
具 栏 ， 这 个 示例 在 19.8 节 示 例 基础 上 添加 了 一 个 
工具 栏 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 :chapterl9/ch19.9.py 


import wx 
import wx.grid 


# 自 定义 窗口 类 MyFrame 


class MyFrame (wx.Frame): 图 19-28 工具 栏 示例 
def _init_ (self): 
super () ._init (parent=None，title=' 使 用 工具 栏 '，size=(550，500)) 
self.Centre() # 设置 窗口 居中 


self.Show (True) 


self.text = wx.TextCtrl (self, -1, style=wx.EXPAND | wx.TE MULTILINE) 
vbox = Wwx.BoxSizer (wx.VERTICAL) 
vbox.Add (self.text, proportion=1, flag=wx.EXPAND | wx.ALL, border=1) 


self.Setsizer (vbox) 
menubar = wx.MenuBar() 


file menu = wx.Menu() 
new item = wx.MenuItem(file menu, wx.ID NEW, text=" 新 建 "，kind=wx.ITEM NORMAL) 
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file menu.Append (new_item) 


file_menu.AppendSeparator () 
edit menu = wx.Menu() 
copy_item = wx.MenuItem(edit menu，100，text=" 复制 "，kind=wx.ITEM NORMAL) 


edit menu.Append (copy_item) 


cut_item = wx.MenuItem(edit menu，, 101，text=" 能 切 "，kind=wx.ITEM_NORMAL) 


edit menu.Append (cut_item) 


paste_item = wx.MenuItem(edit _menu，102，text=" 粘贴 "，kind=wx.ITEM NORMRL) 
edit menu.Append (Paste_item) 


file menu.Append (wx.ID ANY, " 编辑 "， edit_ menu) 


menubar.Append (file_menu，' 文件 ') 
self.SetMenuBar (menubar) 


tb = wx.ToolBar (self, wx.ID ANY) [0 
self.ToolBar = tb © 
tsize = (24, 24) @ 


new_ bmp = wx.ArtProvider.GetBitmap (wx.ART NEW, wx.ART_ TOOLBAR, tsize) @ 
open bmp = Wx.ArtProvider.GetBitmap (wx.ART FILE OPEN, wx.ART TOOLBAR, tsize) 
copy_bmp = wx.ArtProvider.GetBitmap (wx.ART COPY, Wwx.ART_ TOOLBAR, tsize) 
paste bmp = wx.ArtProvider.GetBitmap (wx.ART_ PASTE, Wx.ART TOOLBAR, 
tsize) © 


tb.AddTool (10, "New", new bmp, kind=wx.ITEM NORMAL, shortHelp="New") 
tb.AddTool (20, "Open", open bmp, kind=wx.ITEM NORMAL, shortHelp="Open") 
tb.AddSseparator () @ 
tb .AddTool (30, "Copy", copy_bmp, kind=wx.ITEM NORMAL, shortHelp="Copy") 
tb.AddTool (40, "Paste", paste bmp, kind=wx.ITEM NORMAL, shortHelp="Paste") 
tb.AddSeparator () 


tb.AddTool (201, "back", wx.Bitmap("menu icon/back.png"), kind=wx.ITEM_ 
NORMAL, shortHelp="Back") 

tb.AddTool (202, "forward", wx.Bitmap("menu icon/forward.png"), kind=wx. 
ITEM NORMAL, shortHelp="Forward") 

self.Bind (wx.EVT MENU, self.on click, id=201, id2=202) 

tb .AddSeparator () 


tb .Realize() @ 


def on click(self, event): 
event_ id = event.GetId() 
if event_ id == 201: 
self.text.SetLabel(' 单 击 【Back]】 按钮 ') 
else: 
self.text.SetLabel(' 单 击 【Forward]】 按钮 ') 
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上 述 代码 第 @ 行 是 创建 工具 栏 wx.ToolBar 对 象 。 代 码 第 @ 行 是 将 工具 栏 赋 值 给 顶级 窗口 
的 ToolBar 属性 ， 这 相当 于 在 顶级 创建 中 添加 了 工具 栏 。 代 码 第 @ 行 创建 了 一 个 二 元 组 ， 用 来 
创建 24 像素 X24 像素 图 标 。 代 码 第 名 行 和 第 @ 行 是 使 用 wx.ArtProvider.GetBitmap() 创建 5 
个 24 像素 X24 像素 的 系统 图 标 。 

代码 第 @ 行 是 添加 New 按钮 到 工具 栏 ， 其 中 kind 是 设置 按钮 类 型 ，shortHelp 是 设置 快捷 
帮助 ， 当 鼠标 放 在 上 面 时 ， 会 弹出 气泡 提示 。 代 码 第 @ 行 是 添加 一 个 分 隔 线 。 代 码 第 @ 行 添加 
back 按钮 到 工具 栏 ， 其 中 图 标 是 自 定义 的 ，wx.Bitmap("menu_icon/back.png") 是 创建 一 个 自 定 
义 图 标 。 代 码 第 @ 行 给 工具 栏 中 back 和 forward 按钮 绑 定 了 事件 处 理 方法 self.on_click()。 

最 后 代码 第 @ 行 是 tb.Realize() 提交 工具 栏 设置 ， 工 具 栏 会 显示 在 顶级 窗口 上 。 


本 章 小 结 


本 章 介绍 了 Python 图 形 用 户 界面 编程 技术 一 一 wxPython， 其 中 包括 wxPython 安装 、 事 件 
处 理 、 布 局 管理 、 控 件 、 高 级 窗口 、 菜 单 和 工具 栏 。 


无 论 个 人 计算 机 〈PC) 还 是 智能 手机 现在 都 支持 多 任务 ， 都 能 够 编写 并 发 访问 程序 。 多 线 
程 编程 可 以 编写 并 发 访问 程序 。 


20.1 基础 知识 


线程 究竟 是 什么 ? 在 Windows 操作 系统 出 现 之 前 ，PC 上 的 操作 系统 都 是 单 任务 系统 ， 只 回 知 和 
有 在 大 型 计算 机 上 才 具 有 多 任务 和 分 时 设计 。 随 着 Windows、Linux 等 操作 系统 的 出 现 ， 原 本 
只 在 大 型 计算 机 才 具 有 的 优点 ， 出 现在 了 PC 系统 中 。 


20.1.1 进程 


一 般 可 以 在 同一 时 间 内 执行 多 个 程序 的 操作 系统 都 有 进程 的 概念 。 一 个 进程 就 是 一 个 执行 
中 的 程序 ， 而 每 一 个 进程 都 有 自己 独立 的 一 块 内 存 空间 和 一 组 系统 资源 。 在 进程 的 概念 中 ， 每 
一 个 进程 的 内 部 数据 和 状态 都 是 完全 独立 的 。 在 Windows 操作 系统 下 可 以 通过 Ctrl+AlttDel 
组 合 键 查 看 进程 ， 在 UNIX 和 Linux 操作 系统 下 是 通过 ps 命令 查看 进程 的 。 打 开 Windows 当 
前 运行 的 进程 ， 如 图 20-1 所 示 。 


Python 多 线程 编程 


交 件 (P) 这 项 (0) 直 看 M) 
| 本 媚 应 有 史记 录 启动 用户 详 胡 信息 服务 
1% 16% 2% 0% 
5 cpu| A 在 | 磺 网 各 
> CUiService Wed 0% 14Mi OMBB OMbp 可 
国 jakeM Nedue 0% 6AMa 0M8/ OMbp 
国 jakHKModule 0% 60ME OMS/ OMbp 
igfTray Module 0% 70OM OM OMbp 
> 国 intel(R) Dynamic Application DO% O9MB OMB OMbps 
> 国 Intel(R) Local Management S- 0 256MB OMB/E 0Mbp 
> 国 InteCpHedsvc Executable (3.. 0% 12M6 0M8/ 佬 0Mbps 
图 ,ava Update scheduer (32 0) 9% Og9Ms OMS/ OMbps 
国 Microsof IME 0% oaME OMB/ OMbps 
国 Microsof Maware Protectio.. 0% 18MB OMB/G OoMbps 
B Microsok Wrdows seardhF- 0% oO7MB OMB/ OMbps 
BB Microsok Wndows Seerch p.. 0% 09MB OMB/S OMbps 
EB Microsof Wirdows scarchp_ o 14Ma OMB/B OMbp: 
> 加 Microsoft Wndows Search - 0% 120MB OMB/B OMbp 
» [ MobileDevicesenice 0% 23Me OMB/S OMbp v 
GE SR 


图 20-1 Windows 操作 系统 进程 
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在 Windows 操作 系统 中 一 个 进程 就 是 一 个 exe 或 者 dll 程序 ， 它 们 相互 独立 ， 互 相 也 可 以 
通信 ， 在 Android 操作 系统 中 进程 间 的 通信 应 用 也 是 很 多 的 。 


20.1.2 ”线程 


线程 与 进程 相似 ， 是 一 段 完 成 某 个 特定 功能 的 代码 ， 是 程序 中 单个 顺序 控制 的 流程 ， 但 与 进 
程 不 同 的 是 ， 同 类 的 多 个 线程 共享 一 块 内 存 空 间 和 一 组 系统 资源 。 所 以 系统 在 各 个 线程 之 间 切 换 
时 ， 开 销 要 比 进程 小 得 多 ， 正 因 如 此 ， 线 程 被 称 为 轻 量 级 进程 。 一 个 进程 中 可 以 包含 多 个 线程 。 

Python 程序 至 少 会 有 一 个 线程 ， 这 就 是 主线 程 。 程 序 启动 后 由 Python 解释 器 负责 创建 主 
线程 ， 程 序 结束 时 由 Python 解释 器 负责 停止 主线 程 。 


20.2 threading 模块 


Python 中 有 两 个 模块 可 以 进行 多 线程 编程 ， 即 _thread 和 threading。_thread 模块 提供 了 
多 线程 编程 的 低级 API， 使 用 起 来 比较 烦琐 ，threading 模块 提供 了 多 线程 编程 的 高 级 API， 
threading 基于 _thread 封装 ， 使 用 起 来 比较 简单 。 因 此 ， 本 章 重 点 介绍 使 用 threading 模块 实 
现 多 线程 编程 。 
threading 模块 API 是 面向 对 象 的 ， 其 中 最 重要 的 是 线程 类 Thread， 此 外 还 有 很 多 线程 相 
关 函 数 ， 这 些 函 数 常用 的 有 以 下 几 种 。 
，threading.active_count(): 返回 当前 处 于 活动 状态 的 线程 个 数 。 
*，threading.current thread0: 返回 当前 的 Thread 对 象 。 
*， threading.main_ thread(0): 返回 主线 程 对 象 ， 主 线程 是 Python 解释 器 启动 的 线程 。 
示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter20/ch20.2.py 


import threading 


# 当前 线程 对 象 
t = threading.current thread() (0) 
# 当前 线程 名 


print(t.name) 


# 返回 当前 处 于 活动 状态 的 线程 个 数 


print (threading.active count()) 


# 当前 线程 对 象 
t = threading.main thread() ©@ 
# 主线 程 名 


print (t.name) 


运行 结果 如 下 : 


MainThread 
MainThread 
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上 述 代 码 运行 过 程 中 只 有 一 个 线程 ， 就 是 主线 程 ， 因 此 当前 线程 就 是 主线 程 。 代 码 第 @ 行 
的 threading.current_thread() 函数 和 代码 第 @ 行 的 threading.main_thread0 函数 获得 的 都 是 同一 
个 线程 对 象 。 


20.3 创建 线程 


创建 一 个 可 执行 的 线程 需要 线程 对 象 和 线程 体 这 两 个 要 素 。 

“线程 对 象 : 线程 对 象 是 threading 模块 线程 类 Thread 所 创建 的 对 象 。 

“线程 体 : 线程 体 是 线程 执行 函数 ， 线 程 启动 后 会 执行 该 函数 ， 线 程 处 理 代码 是 在 线程 体 
中 编写 的 。 

提供 线程 体 主要 有 以 下 两 种 方式 。 

(1) 自 定义 函数 作为 线程 体 。 

(2) 继承 Thread 类 重 写 run0 方法 ，run0 方法 作为 线程 体 。 

下 面 分 别 详细 介绍 这 两 种 方式 。 


20.3.1 自 定 义 函 数 作为 线程 体 


创建 线程 Thread 对 象 时 ， 可 以 通过 Thread 构造 方法 将 一 个 自 定义 函数 传递 给 它 ，Thread 
类 构造 方法 如 下 : 


threading.Thread (target=None, name=None, args=()) 
target 参数 是 线程 体 ， 自 定义 函数 可 以 作为 线程 体 ，name 参数 可 以 设置 线程 名 ， 如 果 省 
略 ，Python 解释 器 会 为 其 分 配 一 个 名 字 ; args 是 为 自 定义 函数 提供 参数 ， 它 是 一 个 元 组 类 型 。 


提示 : Thread 构造 方法 还 有 很 多 参数 ， 如 group、kwargs 和 daemon 等 。 由 于 这 些 参数 很 
少 使 用 ， 本 书 不 再 介绍 这 些 参 数 的 使 用 ， 对 此 感 兴趣 的 读者 可 以 参考 Python 官方 文档 了 解 这 
些 参数 。 


下 面 看 一 个 具体 示例 ， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter20/ch20.3.1.py 


import threading 


import time 


# 线程 体 函数 
def thread body(): @ 
# 当前 线程 对 象 
t = threading.current thread() 
for n in range(5): 
# 当前 线程 名 
print (' 第 {0} 次 执行 线程 {1}' .format (n，t 上 -name) ) 
# 线程 休眠 
time.sleep (1) 四 
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print (' 线程 {0} 执行 完成 ! '.format (t.name) ) 


# 主 函数 
def main(): @ 
# 创建 线程 对 象 t1 
t1 = threading.Thread (target=thread body) 
# 启动 线程 tl 
E68tart 人 人 


# 创建 线程 对 象 t2 


t2 = threading.Thread (target=thread body, name="'MyThread') © 
# 启动 线程 上 2 
七 2 .start() 

if _name == "main ， : 


main() 


上 述 代 码 第 @ 行 定义 了 一 个 线程 体 函 数 thread_body()， 在 该 函数 中 可 以 编写 自己 的 线程 处 
理 代码 。 本 例 线程 体 中 进行 了 5 次 循环 ， 每 次 循环 都 会 打印 执行 次 数 和 线程 的 名 字 ， 然 后 让 当 
前 线程 休眠 一 段 时 间 。 代 码 第 @ 行 的 time.sleep(secs) 函数 可 以 使 得 当前 线程 休眠 secs 秒 。 

代码 第 图 行 定 义 了 main0) 主 函 数 ， 在 main() 主 函数 中 创建 了 线程 tl 和 t2。 在 创建 t1 线 
程 时 提供 了 target 参数 ，target 实 参 是 thread_body 函数 名 ， 见 代码 第 @ 行 ， 在 创建 世 线程 
时 提供 了 target 参数 ，target 实 参 是 thread_body 函数 名 ; 还 提供 了 name 参数 设置 线程 名 为 
MyThread， 见 代码 第 @ 行 。 

代码 第 @ 行 _name _ -==' main ' 判 断 当前 模块 名 是 否 为 主 模块 ， 主 模块 是 Python 解 
释 器 指令 启动 的 模块 ， 如 python ch20.3.1.py 指令 。 name “变量 是 模块 名 ，Python 解释 器 
运行 主 模块 时 将 _name _ 变量 修改 为 ' ”main ' 字 符 串 。 当 主 模块 运行 时 则 调用 main() 主 
函数 。 

线程 创建 完成 还 需要 调用 start() 方法 才能 执行 ，start() 方法 一 旦 调用 线程 就 进入 可 以 执行 
状态 。 可 以 执行 状态 下 的 线程 等 待 CPU 调度 执行 ，CPU 调度 后 线程 进行 执行 状态 ， 运 行 线程 
体 函 数 thread_body0。 

运行 结果 如 下 : 

第 0 次 执行 线程 Thread-1 

第 0 次 执行 线程 MyThread 

第 1 次 执行 线程 MyThread 

第 1 次 执行 线程 Thread-1 

第 2 次 执行 线程 MyThread 

第 2 次 执行 线程 Thread-1 

第 3 次 执行 线程 Thread-1 

第 3 次 执行 线程 MyThread 

第 4 次 执行 线程 MyThread 

第 4 次 执行 线程 Thread-1 

线程 MyThread 执行 完成 ! 

线程 Thread-1 执行 完成 ! 
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提示 : 仔细 分 析 运 行 结果 ， 会 发 现 两 个 线程 是 交错 运行 的 ， 总 体感 觉 就 像 是 两 个 线程 在 
同时 运行 。 但 是 实际 上 一 台 PC 通常 就 只 有 一 颗 CPU， 在 某 个 时 刻 只 能 是 一 个 线程 在 运行 ， 而 
了 Python 语言 在 设计 时 就 充分 考虑 到 线程 的 并 发 调度 执行 。 对 于 程序 员 来 说 ， 在 编程 时 要 注意 
给 每 个 线程 执行 的 时 间 和 机 会 ， 主 要 是 通过 让 线程 休眠 的 办 法 (调用 time 模块 的 sleep() 函 
数 ) 来 让 当前 线程 暂停 执行 ， 然 后 由 其 他 线程 来 争夺 执行 的 机 会 。 如 果 上 面 的 程序 中 没有 调 
用 sleep() 函数 进行 休眠 ， 则 就 是 第 一 个 线程 先 执行 完毕 ， 然 后 第 二 个 线程 再 执行 。 所 以 用 活 
sleep() 函数 是 多 线程 编程 的 关键 。 


20.3.2 ”继承 Thread 线程 类 实现 线程 体 


另外 一 种 实现 线程 体 的 方式 是 ， 创 建 一 个 Thread 子 类 ， 并 重 写 run0 方法 ，Python 解释 器 
会 调用 run0) 方法 执行 线程 体 。 
采用 继承 Thread 类 重新 实现 20.3.2 节 示例 ， 自 定义 线程 类 MyThread 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter20/ch20.3.2.py 


import threading 
import time 


class MyThread (threading.Thread) : 
def _init (self, name=None): 


@@e 


super()._init (name=name) 


# 线程 体 函数 
def run(self) : @ 
# 当前 线程 对 象 
t = threading.current thread() 
for n in range(5): 
# 当前 线程 名 
print (' 第 {0} 次 执行 线程 {1}' .format (n，t.name) ) 
# 线程 休眠 
time.sleep (1) 
print (' 线程 {0} 执行 完成 ! ' .format (t.name)) 


# 主 函 数 

def main(): 
# 创建 线程 对 象 tl1 
tl = MyThread () © 
# 启动 线程 tl 


tl.start () 


# 创建 线程 对 象 t2 
t2 = MyThread (name='MyThread') 
# 启动 线程 t2 
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t2.start () 


if _name == ' main _': 


main() 
上 述 代 码 第 @ 行 定义 了 线程 类 MyThread， 它 继承 了 Thread 类 。 代 码 第 @ 行 是 定义 线程 类 
的 构造 方法 ，name 参数 是 线程 名 。 代 码 第 @ 行 是 调用 父 类 的 构造 方法 ， 并 提供 name 参数 。 代 
码 第 @ 行 是 重 写 父 类 Thread 的 run0 方法 ，run() 方法 是 线程 体 ， 需 要 线程 执行 的 代码 编写 在 
这 里 。 代 码 第 @ 行 是 创建 线程 对 象 {1， 没 有 提供 线程 名 。 代 码 第 @ 行 是 创建 线程 对 象 t2， 并 为 
其 提供 线程 名 MyThread。 


20.4 ”线程 管理 


20.4.1 ”等 待 线程 结束 


在 介绍 线程 状态 时 提 到 过 join0 方法 ， 当 前 线程 调用 tl 线程 的 join0 方法 时 则 阻塞 当前 
线程 ， 等 待 tl 线程 结束 ， 如 果 tl 线程 结束 或 等 待 超时 ， 则 当前 线程 回 到 活动 状态 继续 执行 。 
join() 方法 语法 如 下 : 


join (timeout=None) 


参数 timeout 是 设置 超时 时 间 ， 单 位 是 秒 。 如 果 没有 设置 timeout 则 可 以 一 直 等 待 。 
使 用 join0 方法 的 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter20/ch20.4.1.py 


import threading 
import time 


# 共享 变量 
value = 0 O@ 


# 线程 体 函 数 
def thread body() : 
global value @ 
# 当前 线程 对 象 
print ('ThreadA 开始 ...') 
for n in range(2) : 
print ('ThreadA 执行 ...') 
value += 1 回 
# 线程 休眠 


time.sleep (1) 


第 20 章 ”Python 多 线程 编程 | 其 295 
print('ThreadR 结束 ...') 


# 主 函数 
def main(): 
print (' 主线 程 开始 ...') 
# 创建 线程 对 象 t1 
tl = threading.Thread (target=thread body, name='ThreadA') 
# 启动 线程 t1 
tl.start () 
# 主线 程 被 阻塞 ， 等 待 tl 线程 结束 
tl.join() 
print('value = {0}'.format (value) ) 


print (' 主线 程 结束 ...') 


@© 


if _name == '_ main_': 


main() 
运行 结果 如 下 : 


主线 程 开始 ... 
ThreadA 开始 ... 
ThreadA 执行 ... 
ThreadA 执行 ... 
ThreadA 结束 ... 
value = 2 


主线 程 结束 ... 


上 述 代码 第 @ 行 是 定义 一 个 共享 变量 value。 代 码 第 @ 行 是 在 线程 体 中 声明 value 变量 作 
用 域 为 全 局 变量 ， 所 以 代码 第 @ 行 修改 了 value 数值 。 

代码 第 @ 行 是 在 当前 线程 主线 程 ) 中 调用 tl 的 join0 方法 ， 因 此 会 导致 主线 程 阻塞 ， 等 
待 tl 线程 结束 ， 从 运行 结果 可 以 看 出 主线 程 被 阻塞 了 。 代 码 第 @@ 行 是 打印 共享 变量 value， 从 
运行 结果 可 见 value = 2。 

如 果 尝 试 将 tl join0 语句 注释 掉 ， 输 出 结果 如 下 : 

主线 程 开始 .. . 

ThreadA 开始 ... 

ThreadA 执行 ... 

ThreadA 执行 ... 


value = 1 


主线 程 结束 ... 
ThreadA 结束 ... 


从 运行 结果 可 见 子 线程 t 还 没有 结束 ， 主 线程 就 结束 了 。 


提示 : 使 用 join() 方法 的 场景 是 ， 一 个 线程 依赖 于 另外 一 个 线程 的 运行 结果 ， 所 以 调用 另 
一 个 线程 的 join() 方法 等 它 运行 完成 。 
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20.4.2 ”线程 停止 


当 线程 体 结 束 〈 即 run0 方法 或 执行 函数 结束 )， 线 程 就 会 停止 了 。 但 是 有 些 业务 比较 复 
杂 ， 例 如 想 开 发 一 个 下 载 程序 ， 每 隔 一 段 执行 一 次 下 载 任务 ， 下 载 任务 一 般 会 在 子 线程 执行 ， 
休 眼 一 段 时 间 再 执行 。 这 个 下 载 子 线程 中 会 有 一 个 死 循环 ， 为 了 能 够 停止 子 线程 ， 应 设置 一 个 
线程 停止 变量 。 

示例 下 面 如 下 : 


# coding=utf-8 
# 代码 文件 :chapter20/ch20.4.2.py 


import threading 
import time 


# 线程 停止 变量 


isrunning = True (Oy 


# 线程 体 函数 
def thread body(): 
while isrunning: @ 
# 线程 开始 工作 
# TODO 
print(' 下 载 中 ...') 
# 线程 休眠 
time.sleep(5) 
print (' 执行 完成 !") 


# 主 函数 
def main() : 
# 创建 线程 对 象 tl 
tl = threading.Thread (target=thread body) 
# 启动 线程 tl 
tl.start () 
# 从 键盘 输入 停止 指令 exit 
command = input (' 请 输入 停止 指令 : ') 


if command == "exit': 


@ 四 


global isrunning 


isrunning = False 


if _name == ， main ，: 


main() 


上 述 代码 第 @ 行 是 创建 一 个 线程 停止 变量 isrunning， 代 码 第 @ 行 是 在 子 线程 线程 体 中 进行 
循环 ， 当 isrunning = False 时 停止 循环 ， 结 束 子 线程 。 

代码 第 @ 行 是 通过 input(0 函数 从 键盘 读 入 指令 ， 如 果 用 户 输入 的 是 exit 字符 串 ， 则 修改 
循环 结束 变量 isrunning 为 False。 
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测试 时 需要 注意 ， 要 在 控制 台 输入 exit， 然 后 敲 Enter 键 ， 如 图 20-2 所 示 。 


er rr i 
| Pls Cc:\Users\win-mini\AppData\Local\Programs\Python\Python36\p 
加 |#+ | 下载 中 ..。 i 

省 号， 请 输入 停止 指令 : exit 人 ee 

Ei ed, MaiEnier | 


9 
人 Process finished with exit code © 
ix 


45 CRIF: UTF8 。 旨 口 


图 20-2 在 控制 台 输 入 字符 串 


20.5 ”线程 安全 


在 多 线程 环境 下 ， 访 问 相 同 的 资源 ， 有 可 能 会 引发 线程 不 安全 问题 。 本 节 讨论 引发 这 些 问 加 了 
题 的 根源 和 解决 方法 。 


20.5.1 临界 资源 问题 


多 个 线程 同时 运行 ， 有 时 线程 之 间 需 要 共享 数据 ， 一 个 线程 需要 其 他 线程 的 数据 ， 和 否则 就 
不 能 保证 程序 运行 结果 的 正确 性 。 

例如 有 一 个 航空 公司 的 机 票 销售 ， 每 一 天 机 票数 量 是 有 限 的 ， 很 多 售票 点 同时 销售 这 些 机 
票 。 下 面 是 一 个 模拟 的 销售 机 票 系统 ， 示 例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter20/ch20.5.1.py 


import threading 
import time 


class TicketDB: 
def _init_ (self): 
# 机 票 的 数量 


self.ticket count = 5 O 


# 获得 当前 机 票数 量 
def get ticket count (self): 加 


return self.ticket count 


# 销售 机 票 

def sell ticket (self) : @ 
# TODO 等 于 用 户 付款 
# 线程 休眠 ， 阻 塞 当前 线程 ， 模 拟 等 待 用 户 付款 


time.sleep (1) @ 
print ("第 {01 号 票 ， 已 经 售 出 ".format (self.ticket_count)) 
self.ticket count -= 1 © 


上 述 代 码 创建 了 TicketDB 类 ，TicketDB 类 模拟 机 票 销售 过 程 ， 代 码 第 @ 行 定义 了 机 票数 
量 成 员 变 量 ticket_count， 这 是 模拟 当天 可 供销 售 的 机 票数 ， 为 了 测试 方便 初始 值 设置 为 5。 代 
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码 第 @ 行 定义 了 获取 当前 机 票数 的 get_ticket_count() 方法 。 代 码 第 @ 行 是 销售 机 票 方 法 ， 和 售票 
网 点 查询 有 票 可 以 销售 ， 那 么 会 调用 sell_ticket0 方法 销售 机 票 ， 这 个 过 程 中 需要 等 待 用 户 付 
款 ， 付 款 成 功 后 ， 会 将 机 票数 减 一 ， 见 代码 第 @ 行 。 为 模拟 等 待 用 户 付款 ， 在 代码 第 @ 行 使 用 
了 sleep0 方法 让 当前 线程 阻塞 。 

调用 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter20/ch20.5.1.py 


import threading 
import time 


# 创建 TicketDB 对 象 
db = TicketDB() 


# 线程 体 1 函数 
def threadl body(): O 
global db # 声明 为 全 局 变量 


while True: 


curr ticket count = db.get ticket count() [(@) 
# 查询 是 否 有 票 
if curr ticket count > 0: @ 
db.sell ticket() 四 
else: 
# 无 票 退出 
break 
# 线程 体 2 函数 
def thread2_body() : © 
global db  # 声明 为 全 局 变量 
while True: 
curr ticket count = db.get ticket_ count() 
# 查询 是 否 有 票 
if curr ticket count > 0: 
db.sell ticket() 
else: 
# 无 票 退 出 
break 
# 主 函 数 
def main(): 
# 创建 线程 对 象 tl 
tl1 = threading.Thread (target=threadl body) 
# 启动 线程 t1 
t1.start () 


# 创建 线程 对 象 t2 
t2 = threading.Thread (target=thread?2 body) @ 
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# 启动 线程 上 2 
t2.start() 


if _name == ' main_': 


main () 


上 述 代码 创建 了 两 个 线程 ， 模 拟 两 个 售票 网 点 ， 每 一 个 线程 所 做 的 事情 类 似 。 代 码 第 @ 行 
和 第 @ 行 创建 了 两 个 线程 ， 代 码 第 @ 行 和 第 @ 行 是 两 线程 对 应 的 线程 体 函 数 ， 线 程 体 1 函数 和 
线程 体 2 函数 所 执行 的 代码 是 类 似 的 。 在 线程 体 中 ， 首 先 获得 当前 机 票数 量 ( 见 代 码 第 @ 行 )， 
然后 判断 机 票数 量 是 否 大 于 零 ( 见 代码 第 @ 行 )， 如 果 有 票 则 出 票 ( 见 代码 第 @ 行 )， 否 则 退出 
循环 ， 结 束 线程 。 

一 次 运行 结果 如 下 : 

第 5 号 票 ， 已 经 售 出 

第 5 号 票 ， 已 经 售 出 

第 3 号 票 ， 已 经 售 出 

第 3 号 票 ， 已 经 售 出 

第 1 号 票 ， 已 经 售 出 

第 0 号 票 ， 已 经 售 出 


虽然 可 能 每 次 运行 的 结果 都 不 一 样 ， 但 是 从 结果 看 还 是 能 发 现 一 些 问题 : 同一 张 票 重复 销 
售 、 出 现 第 0 号 票 和 5 张 票 卖 了 6 次 。 这 些 问 题 的 根本 原因 是 多 个 线程 间 共 享 的 数据 导致 了 数 
据 的 不 一 致 性 。 


提示 : 多 个 线程 间 共 享 的 数据 称 为 共享 资源 或 临界 资源 ， 由 于 CPU 负责 线程 的 调度 ， 程 
序 员 无 法 精确 控制 多 线程 的 交替 顺序 。 这 种 情况 下 ， 多 线程 对 临界 资源 的 访问 有 时 会 导致 数据 
的 不 一 致 性 。 


20.5.2 ”多 线程 同步 


为 了 防止 多 线程 对 临界 资源 的 访问 有 时 会 导致 数据 的 不 一 致 性 ，Python 提供 了 “ 互 斥 ” 机 
制 ， 可 以 为 这 些 资 源 对 象 加 上 一 把 “ 互 斥 锁 ”， 在 任 一 时 刻 只 能 由 一 个 线程 访问 ， 即 使 该 线程 
出 现 阻塞 ， 该 对 象 的 被 锁定 状态 也 不 会 解除 ， 其 他 线程 仍 不 能 访问 该 对 象 ， 这 就 是 多 线程 同 
步 。 线 程 同步 是 保证 线程 安全 的 重要 手段 ， 但 是 线程 同步 客观 上 会 导致 性 能 下 降 。 

对 于 简单 线程 同步 可 以 使 用 threading 模块 的 Lock 类 。Lock 对 象 有 两 种 状态 ， 即 “锁定 ” 
和 “未 锁定 ”， 默 认 是 “未 锁定 ”状态 。Lock 对 象 有 acquire() 和 release() 两 个 方法 实现 锁定 和 
解锁 ，acquire() 方法 可 以 实现 锁定 ， 使 得 Lock 对 象 进入 “锁定 ” release() 方法 可 以 实现 解锁 ， 
使 得 Lock 对 象 进 入 “未 锁定 ”。 

重 构 20.5.1 节 售票 系统 示例 ， 代 码 如 下 : 

# coding=utf-8 

# 代码 文件 : chapter20/ch20.5.2.py 


import threading 


import time 
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class TicketDB: 
def _init (self): 
# 机 票 的 数量 


self.ticket count = 5 


# 获得 当前 机 票数 量 
def get ticket count (self) : 
return self.ticket count 


# 销售 机 票 
def sell ticket (self): 
# TODO 等 待 用 户 付款 
# 线程 休眠 ， 阻 塞 当前 线程 ， 模 拟 等 待 用 户 付款 
time.sleep(1) 
print ("第 {0} 号 票 ， 已 经 售 出 " .format (self.ticket_count)) 
self.ticket count -= 1 


# 创建 TicketDB 对 象 

db = TicketDB () 

# 创建 Lock 对 象 

lock = threading.Lock() @ 


# 线程 体 1 函数 
def threadl body() : 
global db, lock # 声明 为 全 局 变量 
while True: 
lock.acquire() @ 
curr ticket count = db.get ticket count() 
# 查询 是 否 有 票 
if curr ticket count > 0: 
db.sell ticket() 


else: 
lock.release() @ 
# 无 票 退出 
break 

lock.release() @ 


time.sleep (1) 


# 线程 体 2 函数 
def thread2 body(): 
global db, lock # 声明 为 全 局 变量 
while True: 
lock.acquire() 
curr ticket count = db.get ticket count() 
# 查询 是 否 有 票 
if curr ticket count > 0: 


db.sell ticket() 
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else: 
lock.release() 
# 无 票 退 出 
break 

lock.release() 


time.sleep (1) 


# 主 函 数 
def main(): 
# 创建 线程 对 象 tl 
tl = threading.Thread (target=thread1l_body) 
# 启动 线程 tl 
tl.start () 
# 创建 线程 对 象 t2 
t2 = threading.Thread (target=thread2 body) 
# 启动 线程 t2 
t2.start () 


if _name == '_ main_': 


main() 


上 述 代码 第 @ 行 创建 了 Lock 对 象 。 代 码 第 @ 行 ~ 第 @ 行 是 需要 同步 的 代码 ， 每 一 个 时 刻 
只 能 由 一 个 线程 访问 ， 需 要 使 用 锁定 。 代 码 第 @ 行 使 用 了 lock.acquire() 加 锁 ， 代 码 第 @ 行 和 
第 @ 行 使 用 了 lock.release() 解锁 。 由 于 线程 体 1 函数 和 线程 体 2 函数 类 似 ， 这 里 不 再 效 述 。 

运行 结果 如 下 : 

第 5 号 票 ， 已 经 售 出 

第 4 号 票 ， 已 经 售 出 

第 3 号 票 ， 已 经 售 出 

第 2 号 票 ， 已 经 售 出 

第 1 号 票 ， 已 经 售 出 


从 上 述 运行 结果 可 见 ， 没 有 再 出 现 20.5.1 节 的 问题 ， 这 说 明 线 程 同步 成 功 ， 是 安全 的 。 


20.6 ”线程 间 通 信 


第 20.5 节 的 示例 只 是 简单 地 加 锁 ， 但 有 时 情况 会 更 加 复杂 ， 如 果 两 个 线程 之 间 有 依赖 关 加 为 
系 ， 线 程 之 间 必 须 进行 通信 ， 互 相 协调 才能 完成 工作 。 实 现 线程 间 通 信 ， 可 以 使 用 threading 5 
模块 中 的 Condition 和 Event 类 。 下 面 分 别 介 绍 Condition 和 Event 的 使 用 。 


20.6.1 使 用 Condition 实现 线程 间 通 信 


Condition 被 称 为 条 件 变量 ，Condition 类 提供 了 对 复杂 线程 同步 问题 的 支持 ， 除 了 提供 与 
Lock 类 似 的 acquireO 和 release0 方法 外 ， 还 提供 了 wait0、notifyO0 和 notify_all0 方法 ， 这 些 
方法 语法 如 下 : 

。wait(timeout=None) : 使 当前 线程 释放 锁 ， 然 后 当前 线程 处 于 阻塞 状态 ， 等 待 相 同 条 件 

变量 中 其 他 线程 唤醒 或 超时 ，timeout 是 设置 超时 时 间 ; 
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*。notifyO0: 唤醒 相同 条 件 变量 中 的 一 个 线程 ; 

，notify_all(): 唤醒 相同 条 件 变 量 中 的 所 有 线程 。 

下 面 通过 一 个 示例 熟悉 Condition 实现 线程 间 通 信 问 题 。 一 个 经 典 的 线程 间 通信 是 “堆栈 ” 
数据 结构 ， 一 个 线程 生成 一 些 数据 ， 将 数据 压 栈 ;， 另 一 个 线程 消费 这 些 数 据 ， 将 数据 出 栈 。 这 
两 个 线程 互相 依赖 ， 当 堆栈 为 空 ， 消 费 线程 无 法 取出 数据 时 ， 应 该 通知 生成 线程 添加 数据 ， 当 
堆栈 已 满 ， 生 产 线程 无 法 添加 数据 时 ， 应 该 通知 消费 线程 取出 数据 。 

消费 和 生产 示例 中 堆栈 类 代码 : 


# coding=utf-8 
# 代码 文件 : chapter20/ch20.6.1.py 


import threading 
import time 
import random 


# 创建 条 件 变量 对 象 


condition = threading.Condition() © 


class Stack: @ 
def _init_ (self) : 
# 堆栈 指针 初始 值 为 0 
self.pointer = 0 
# 堆栈 有 5 个 数字 的 空间 
self.data = [-1，-1，-1，-1，-1] 


# 压 栈 方法 
def push(self, c): © 
global condition 
condition.acquire() 
# 堆栈 已 满 ， 不 能 压 栈 
while self.pointer == len(self.data) : 
# 等 待 其 他 线程 把 数据 出 栈 
condition.wait() 
# 通知 其 他 线程 把 数据 出 栈 
condition.notify() 
# 数据 压 栈 
self.data[self.pointer] = c 
# 指针 向 上 移动 
self.pointer += 1 


condition.release() 


# 出 栈 方法 
def pop (self) : 
global condition 
condition.acquire() 
# 堆栈 无 数据 ， 不 能 出 栈 
while self.pointer == 0: 


# 等 待 其 他 线程 把 数据 压 栈 
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condition.wait () 
# 通知 其 他 线程 压 栈 
condition.notify() 

# 指针 向 下 移动 

self.pointer -= 1 

data = self.data[self.pointer] 
condition.release() 

# 数据 出 栈 


return data 


上 述 代码 第 @ 行 创建 了 条 件 变量 对 象 。 代 码 第 @ 行 定义 了 Stack 堆栈 类 ， 该 堆栈 有 最 多 5 
个 元 素 的 空间 ， 代 码 第 @ 行 定义 并 初始 化 了 堆栈 指针 ， 堆 栈 指针 是 记录 栈 项 位 置 的 变量 。 代 码 
第 @ 行 是 堆栈 空间 ，-1 表示 没有 数据 。 

代码 第 @ 行 定义 了 压 栈 方法 push()， 该 方法 中 的 代码 需要 同步 ， 因 此 在 该 方法 开始 时 通过 
condition.acquire() 语句 加 锁 ， 在 该 方法 结束 时 通过 condition.release() 语句 解锁 。 另 外 ， 在 该 
方法 中 需要 判断 堆栈 是 否 已 满 ， 如 果 已 满 不 能 压 栈 ， 调 用 condition.wait() 让 当前 线程 进入 等 
待 状态 中 。 如 果 堆 栈 未 满 ， 程 序 会 往 下 运行 调用 condition.notify() 唤醒 一 个 线程 。 

代码 第 @ 行 声明 了 出 栈 的 pop0 方法 ， 与 push() 方法 类 似 ， 这 里 不 再 效 述 。 

调用 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter20/ch20.6.1.py 


import threading 
import time 


# 创建 堆栈 Stack 对 象 
stack = Stack() 


# 生产 者 线程 体 函 数 
def producer thread body(): O 
global stack # 声明 为 全 局 变量 
# 产生 10 个 数字 
for i in range(0，10) : 
# 把 数字 压 栈 
stack.push (i) @ 
# 打印 数字 
print (' 生产 : {0}'.format (i)) 
# 每 产生 一 个 数字 ， 线 程 就 睡眠 


time.sleep (1) 


# 消费 者 线程 体 函数 

def consumer thread body(): @ 
global stack # 声明 为 全 局 变量 
# 从 堆栈 中 读 取 数字 


for i in range(0, 10): 
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# 从 堆栈 中 读 取 数字 

x = stack.pop() 四 
# 打印 数字 

print (' 消费 ， {0}' .format (x)) 

# 每 消费 一 个 数字 ， 线 程 就 睡眠 


time.sleep (1) 


# 主 函 数 
def main(): 
# 创建 生产 者 线程 对 象 producer 
producer = threading.Thread (target=producer thread body) ©® 
# 启动 生产 者 线程 
producer.start () 
# 创建 消费 者 线程 对 象 consumer 
consumer = threading.Thread (target=consumer thread body) 
# 启动 消费 者 线程 


Consumer .start() 


if _ name == ' main_': 


main() 


上 述 代码 第 @@ 行 是 创建 生产 者 线程 对 象 ， 代 码 第 @ 行 是 生产 者 线程 体 函数 ， 在 该 函数 中 把 
产生 的 数字 压 栈 ， 见 代码 第 @ 行 ， 然 后 休眠 一 秒 。 代 码 第 @ 行 是 创建 消费 者 线程 对 象 ， 代 码 第 
@ 行 是 消费 者 线程 体 函 数 ， 在 该 函数 中 把 产生 的 数字 出 栈 ， 见 代码 第 @ 行 ， 然 后 休眠 一 秒 。 

运行 结果 如 下 : 


生产 ; 
消费 ; 
中 产 ， 
消费 : 
生产 ， 
消费 : 
生产 ; 
消费 : 
所 
消费 : 
人 生产， 
消费 : 
生产 ， 
消费 : 
ns 
消费 : 
生产 ， 
消费 : 
生产 ， 
消费 : 


从 上 述 运行 结果 可 见 ， 先 有 生产 然后 有 消费 ， 这 说 明 线程 间 的 通信 是 成 功 的 。 如 果 线 程 间 
没有 成 功 的 通信 机 制 ， 可 能 会 出 现 如 下 的 运行 结果 。 


oonmowwNN Nr poo 
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生产 :0 
消费 : 0 
消费 ， -1 
全 二 1 


“-1” 表 示 数 据 还 没有 生产 出 来 ， 消 费 线程 消费 了 还 没有 生产 的 数据 ， 这 是 不 合理 的 。 
20.6.2 ”使 用 Event 实现 线程 间 通 信 


使 用 条 件 变量 Condition 实现 线程 间 通 信 还 是 有 些 烦琐 。threading 模块 提供 的 Event 可 以 
实现 线程 间 通 信 。Event 对 象 调用 wait(timeout=None) 方法 会 阻塞 当前 线程 ， 使 线程 进入 等 待 
状态 ， 直 到 另 一 个 线程 调用 该 Event 对 象 的 set() 方法 ， 通 知 所 有 等 待 状态 的 线程 恢复 运行 。 

重 构 20.6.1 节 示例 中 堆栈 类 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter20/ch20.6.2.py 


import threading 
import time 


event = threading.Event() (0) 


class Stack: 
def _init_ (self): 
# 堆栈 指针 初始 值 为 0 
self.pointer = 0 
# 堆栈 有 5 个 数字 的 空间 
selfsdata = [=l; -1, =1; -1l: -1] 


# 压 栈 方法 
def push(self，c) : 
global event 
# 堆栈 已 满 ， 不 能 压 栈 
while self.pointer == len(self.data): 
# 等 待 其 他 线程 把 数据 出 栈 
event .wait () @ 
# 通知 其 他 线程 把 数据 出 栈 
event .set() 加 
# 数据 压 栈 
self.data[self.pointer] = c 
# 指针 向 上 移动 


self.pointer += 1 


# 出 栈 方法 

def pop (self) : 
global event 
# 堆栈 无 数据 ， 不 能 出 栈 
while self.pointer == 0: 


# 等 待 其 他 线程 把 数据 压 栈 
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event .wait () 
# 通知 其 他 线程 压 栈 

event .set () 

# 指针 向 下 移动 

self.pointer -= 1 

# 数据 出 栈 

data = self.data[self.pointer] 


return data 


上 述 代码 第 @@ 行 创建 了 Event 对 象 。 压 栈 方法 push() 中 ， 代 码 第 @ 行 event.wait() 是 阻塞 
当前 线程 等 待 其 他 线程 唤醒 。 代 码 第 @ 行 event.set() 是 唤醒 其 他 线程 。 出 栈 的 pop( 方法 与 
push() 方法 类 似 ， 这 里 不 再 玖 述 。 

比较 20.6.1 节 可 见 ， 使 用 Event 实现 线程 间 通信 要 比 使 用 Condition 实现 线程 间 通 信 简单 。 
Event 不 需要 使 用 “ 锁 ” 同 步 代码 。 


本 章 小 结 


本 章 介 绍 了 Python 线程 技术 ， 首 先 介绍 了 线程 相关 的 一 些 概念 ， 然 后 介绍 了 创建 线程 、 
线程 管理 、 线 程 安全 和 线程 间 通 信 等 内 容 ， 其 中 创建 线程 和 线程 管理 是 学 习 的 重点 ， 此 外 应 掌 
握 线程 状态 和 线程 安全 ， 了 解 线程 间 通 信 。 


第 四 篇 
项 目 实战 


本 篇 包括 4 章 内 容 ， 通 过 4 个 项 目 介绍 了 Python 项 目 开发 过 程 以 及 相关 的 技术 。 
内 容 包 括 项 目 实战 1 : 网 络 爬 虫 与 朴 取 股票 数据 ， 项 目 实战 2 : 数据 可 视 化 与 股票 数 
据 分 析 ， 项 目 实战 3 : PetStore 宠物 商店 项 目 和 项 目 实战 4 : 开发 Python 版 QQ2006 
聊天 工具 。 通 过 本 篇 的 学 习 ， 读 者 能 将 书 中 介绍 的 Python 知识 应 用 于 实际 项 目 开发 ， 
并 进一步 消化 和 吸收 书 中 所 讲 ， 了 解 项 目 开发 过 程 。 
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第 22 章 项 目 实战 2: 数据 可 视 化 与 股票 数据 分 析 

第 23 章 项 目 实 战 3: PetStore 宠物 商店 项 目 

第 24 章 项 目 实战 4: 开发 Python 版 QQ2006 聊天 工具 


Oooo 
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项 目 实 战 1: 网络 息 虫 与 


> 的 取 股 票数 据 


互联 网 是 一 个 巨大 的 资源 库 ， 只 要 方法 适当 ， 就 可 以 找到 你 所 需要 的 数据 。 少 量 的 数据 可 
以 人 工 去 找 ， 但 是 对 于 大 量 的 数据 ， 而 且 数 据 获取 之 后 还 要 进行 分 析 ， 那 么 靠 人 工 就 无 法 完成 
这 些 任务 ， 因 此 就 需要 通过 一 个 计算 机 程序 来 完成 这 些 工作 ， 这 就 是 网 络 息 虫 。 这 一 章 通 过 让 
取 股 票数 据 项 目 介绍 网 络 扑 虫 技术 。 

提示 : Python 社区 中 有 一 个 网 络 爬 虫 框 架 一 Scrapy ( https://scrapy.org/)，Scrapy 封装 了 网 络 扑 
虫 的 技术 细节 ， 使 得 开发 人 员 编写 网 络 爬 虫 更 加 方便 。 本 书 并 不 介绍 Scrapy 框架 ， 而 是 介绍 实现 网 
络 爬 虫 的 基本 技术 。 本 章 通过 一 个 爬 取 股票 数据 项 目 ， 介 绍 网 络 爬 虫 技 术 。 读 者 通过 本 章 的 学 习 ， 
一 方面 可 以 消化 吸收 本 书 之 前 讲解 的 Python 技术 ， 另 一 方面 可 以 掌握 网 络 爬 虫 的 技术 原理 。 


21.1 ”网络 仆 虫 技术 概述 


网 络 疏 虫 (又 被 称 为 网 页 蜂 蛛 ， 网 络 机 器 人 )， 是 一 种 按照 一 定 的 规则 ， 自 动 地 疏 取 互联 网 
数据 的 计算 机 程序 。 编 写 网 络 怜 虫 程序 主要 涉及 的 技术 有 网 络 通信 技术 、 多 线程 并 发 技术 、 数 
a 据 交 换 技术 、HTML 等 Web 前 端 技术 、 数 据 分 析 技 术 和 数据 存储 技术 等 。 


21.1.1 网 络 通信 技术 


网 络 疏 虫 程序 首先 要 通过 网 络 通信 技术 访问 互联 网 资源 ， 这 些 资源 通过 URL 指定 ， 基 于 
HTTP 和 HTTPS 协议 。 具 体 而 言 ， 在 Python 中 可 以 通过 urllib 库 访 问 互联 网 资源 ， 关 于 这 些 
技术 在 本 书 第 18.4 节 进 行 了 全 面 而 详细 的 介绍 ， 这 里 不 再 袭 述 。 

21.1.2 ”多 线程 技术 

一 些 为 搜索 引擎 息 取 数据 的 息 虫 ， 需 要 24 小 时 不 停 地 工作 ， 而 且 数 据 量 非常 大 。 为 提高 效率 
这 些 疏 虫 往往 通过 多 个 线程 并 发 执行 ， 这 就 需要 使 用 多 线程 并 发 技术 。 另 外 有 些 疏 虫 只 访问 专门 的 
网 站 ， 定 时 让 取 特定 数据 ， 例 如 股票 数据 是 定时 更 新 的 ， 这 可 以 通过 多 线程 技术 实现 ， 主 要 是 使 用 
多 线程 的 休 眼 特性 ， 而 不 是 它 的 并 发 特性 。 可 以 通过 一 个 子 线程 根据 特定 时 间 执 行 让 虫 程序 ， 然 后 
休眠 ， 然 后 再 执行 疏 虫 程序 ， 这 样 周 而 复 始 。 本 书 第 20 章 详细 介绍 了 多 线程 技术 ， 这 里 不 再 熬 述 。 


21.1.3 数据 交换 技术 


从 互联 网 获得 的 资源 可 能 是 规范 的 XML、JSON 等 数据 格式 ， 这 些 数据 可 以 通过 数据 交换 
技术 进行 解析 。 本 书 第 16 章 详 细 地 介绍 了 这 些 技术 ， 这 里 不 再 歼 述 。 
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21.1.4 ”Web 前 端 技术 


有 时 从 互联 网 获得 的 资源 并 不 是 规范 的 XML、JSON 等 数据 格式 ， 而 是 HIML、CSS 和 
JavaScript 等 数据 格式 ， 这 些 数据 在 浏览 器 中 会 显示 出 漂亮 的 网 页 ， 这 就 是 Web 前 端 技术 。 
HTML 等 技术 细节 超出 了 本 书 介绍 的 范围 ， 希 望 广大 读者 通过 其 他 渠道 掌握 相关 技术 。 

在 网 络 怜 虫 疏 取 HTML 代码 时 ， 开 发 人 员 需 要 知道 所 需要 的 数据 训 挟 在 哪些 HTML 标签 
中 ， 要 想 找 到 这 些 数据 ， 可 以 使 用 一 些 浏览 器 中 的 Web 开发 工具 。 笔 者 推荐 使 用 Chrome 或 
Firefox 浏览 器 ， 因 为 它们 都 自 带 了 Web 开发 工具 箱 。Chrome 浏览 器 可 以 通过 菜单 “更 多 工 
具 ” 一 “开发 者 工具 ”打开 ， 如 图 21-1 所 示 。Firefox 浏览 器 可 以 通过 菜单 “ Web 开发 者 ”一 
“ 切换 工具 箱 ” 打 开 ， 如 图 21-2 所 示 。 或 者 可 以 通过 快捷 键 打开 它们 ， 在 Windows 平台 下 两 
个 浏览 器 打开 Web 工具 箱 都 是 使 用 快捷 键 Ctrl+Shiftri。 


图 21-2 ”Firefox 浏览 器 Web 开发 工具 箱 


对 比 图 21-1 和 图 21-2 可 见 ，Chrome 开发 工具 箱 与 Firefox 开发 工具 箱 非常 类 似 ，Chrome 
中 的 Elements 与 Firefox 中 的 查看 器 功能 类 似 ， 可 以 查看 HTML 代码 与 页 面 的 对 应 关系 。 
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21.1.5 数据 分 析 技 术 


从 互联 网 获得 的 数据 往往 需要 数据 分 析 ， 如 果 是 规范 的 数据 格式 ， 如 XML、JSON 等 ， 可 
以 通过 本 书 第 16 章 技术 实现 数据 分 析 。 但 如 果 是 HTML 等 数据 ， 那 么 就 非常 麻烦 。HTML 
设计 的 初衷 是 给 “人 ”使 用 的 ， 而 XML 和 JSON 是 给 计算 机 程序 使 用 的 。 从 服务 器 返回 的 
HTML 代码 ， 虽 然 HTML 代码 杂乱 无 章 而 且 数据 量 巨大 ， 如 图 21-3 所 示 ， 但 通过 浏览 器 加 载 
后 会 呈现 出 漂亮 的 网 页 ， 如 图 21-4 所 示 。 


15, 2018 </span>hnbsp;-g&n 
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图 21-3 HTML 代码 
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图 21-4 与 图 21-3 所 示 HTML 代码 对 应 的 网 页 


一 般 人 不 会 关心 HTML 代码 ， 但 作为 网 络 怜 虫 的 开发 人 员 ， 则 需要 分 析 这 些 HTML 代 
码 ， 抽 丝 剥 草 找 到 所 需要 的 数据 ， 这 个 工作 是 比较 烦琐 的 ， 而 且 没 有 统一 的 规范 ， 需 要 具体 问 
题 具体 分 析 。 所 需要 的 技术 主要 是 字符 串 处 理 技 术 ， 还 有 正则 表达 式 等 技术 。 对 于 HTML 代 
码 的 分 析 也 可 以 借助 第 三 方 库 ， 如 BeautifulSoup 等 。 
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21.1.6 ”数据 存储 技术 


数据 分 析 完成 后 需要 保存 起 来 ， 最 理想 的 数据 保存 场所 是 数据 库 ， 由 于 这 些 数据 是 相互 关联 的 
关系 型 数据 库 ， 如 Oracle、SQL Server、MySQL 和 SQLite 等 。 这 些 技术 读者 可 以 参考 本 书 第 17 章 。 

少量 数据 也 可 以 保存 到 文件 中 ， 这 些 文件 应 该 是 结构 化 的 文档 ， 采 用 XML、JSON 和 
CSV 等 数据 交换 格式 。 这 些 技术 读者 可 以 参考 本 书 第 15 章 和 第 16 章 。 


21.2 ”的 取 数据 


疏 取 数据 是 网 络 息 虫 工 作 的 第 一 步 。 互 联网 中 提供 的 数据 形式 多 种 多 样 ， 虽 然 也 会 有 
XML、JSON 和 CSV 等 结构 化 的 数据 ， 但 访问 这 些 数据 的 API 一 般 很 少 对 外 开放 ， 只 是 内 部 
使 用 。 容 易 得 到 的 数据 往往 都 里 挟 在 HTML 代码 中 ， 需 要 进行 烦琐 的 分 析 和 提取 。 扫 冯 大 视频 


21.2.1 ”网 页 中 静态 和 动态 数据 


里 挟 在 HTML 代码 中 的 数据 并 非 唾 手 可 得 。 大 多 数 情 况 下 ，Web 前 端 与 后 台 服 务 器 进行 
通信 时 采用 同步 请 求 ， 即 一 次 请 求 返回 整个 页 面 所 有 的 HTML 代码 ， 这 些 里 挟 在 HTML 中 的 
数据 就 是 所 谓 的 “静态 数据 ”。 为 了 改善 用 户 体验 ，Web 前 端 与 后 台 服 务 器 通信 也 可 以 采用 异 
步 请 求 技术 AJAX?， 异 步 请 求 返回 的 数据 就 是 所 谓 的 “动态 数据 ”， 异 步 请 求 返回 的 数据 一 般 
是 JSON 或 XML 等 结构 化 数据 ，Web 前 端 获得 这 些 数 据 后 ， 再 通过 JavaScript 脚本 程序 动态 
地 添加 到 HTML 标签 中 。 


提示 : 同步 请 求 也 可 以 有 动态 数据 。 就 是 一 次 请 求 返 回 所 有 HTML 代码 和 数据 ， 数 据 并 不 
是 HTML 放 到 标签 中 的 ， 而 是 被 隐藏 起 来 ， 例 如 放 到 hide 等 隐藏 字段 中 ， 或 放 到 JavaScript 
脚本 程序 的 变量 中 。 然 后 再 通过 JavaScript 脚本 程序 动态 地 添加 到 HTML 标签 中 。 


图 21-5 所 示 的 搜狐 证 券 网 页 显示 了 某 只 股票 的 历史 数据 ， 其 中 图 21-5 (a) 所 示 的 HTML 
内 容 都 是 静态 数据 ， 而 动态 数据 则 由 JavaScript 脚本 程序 动态 地 添加 到 HTML 标签 中 ， 如 图 
21-5 (b) 所 示 。 


(a ) 静态 数据 (b ) 动态 数据 
图 21-5 ”网 页 中 的 数据 


@ AJAX(Asynchronous JavaScript and XML)，AJAX 可 以 异步 发 送 请 求 获取 数据 ， 请 求 过 程 中 不 用 刷新 页 面 ， 
用 户 体验 好 ， 而 且 异 步 请 求 过 程 中 ， 不 返回 整个 页 面 的 HTML 代码 ， 只 是 返回 少量 的 数据 ， 这 样 可 以 减少 对 网 络 资 源 
的 占用 ， 提 高 通信 效率 。 
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网 站 采用 静态 数据 还 是 动态 数据 要 看 网 站 的 具体 请 求 ， 例 如 纳 斯 达 克 股 票 历史 数据 是 静态 
的 ， 搜 狐 证 券 提 供 的 股票 历史 数据 是 静态 的 。 静 态 数据 和 动态 数据 会 影响 到 采用 什么 样 的 网 络 
请 求 库 ， 数 据 分 析 和 提取 也 会 有 所 不 同 。 


21.2.2 ”使 用 urllib 仆 取 数据 


在 第 18 章 介 绍 过 网 络 请 求 库 urllib， 它 只 能 进行 同步 请 求 ， 不 能 进行 异步 请 求 。 但 是 如 果 
能 找到 获得 动态 数据 的 异步 请 求 网 址 和 参数 ， 也 可 通过 urllib 发 送 请 求 返回 数据 。 

1. 获得 静态 数据 

21-4 所 示 的 页 面 是 苹果 公司 在 纳 斯 达 克 的 股票 历史 数据 ， 它 是 静态 数据 ， 相 对 比较 容 
易 获得 ， 它 的 网 址 是 https://www.nasdaq.com/symbol/aapl/historical#.UWdnJBDMhHk。 获 得 它 
的 HTML 代码 的 示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter21/ch21.2.2-1.py 


import urllib.request 


url 
req 


= 'https://www.nasdaq.com/symbol/aapl/historical#.UWdnJBDMhHKk' 
= urllib.request.Request (url) 

with urllib.request.urlopen (req) as response: 

data = response.read() 

htmlstr = data.decode () 

print (htmlstr) 


输出 结果 如 下 : 
<table> 
<tbody> 


<tr> 
<td> 
03/15/2018 
</td> 
<td> 
178.5 
</td> 
<td> 
180.24 
</td> 
<td> 
178.0701 
</td> 
<td> 
178.65 
</td> 
<td> 
22,676,520 
</td> 
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</tr> 
</tbody> 
</table> 


上 述 代 码 读者 应 该 比较 容易 读 懂 ， 这 些 技术 在 第 18 章 都 已 经 介绍 过 了 。 那 么 如 何 证 明 返 
回 的 数据 是 静态 数据 呢 ? 可 以 通过 在 返回 的 HTML 代码 中 查找 页 面 中 的 关键 字 来 证 明 是 否 是 
静态 数据 ， 例 如 2018 年 3 月 15 日 的 开盘 价 是 178.5， 读 者 可 以 查找 178.5 关键 字 是 否 存 在 。 

2. 获得 动态 数据 

图 21-5 所 示 的 页 面 是 搜狐 证 券 提 供 的 股票 历史 数据 ， 它 是 动态 数据 ， 而 且 它 的 动态 数据 
不 是 通过 AJAX 异步 请 求 获得 的 ， 而 是 同步 请 求 返回 后 ， 隐 藏 在 JavaScript 变量 中 的 。 这 些 结 
论 是 通过 Chrome 浏览 器 或 Firefox 浏览 器 的 Web 工具 箱 分 析 而 知 的 。 首 先 需 要 在 浏览 器 中 打 
开 http://q.stock.sohu.com/cn/600519/lshq.shtml 网 址 ， 该 网 址 是 贵州 茅台 股票 的 历史 数据 ， 然 
后 打开 Web 工具 箱 ， 如 图 21-6 所 示 。 打 开 Firefox 的 Web 工具 箱 后 ， 选 中 网 络 标签 ， 网 络 标 
签 可 以 查看 所 有 的 网 络 请 求 ， 下 面 的 表格 中 的 每 一 行 表示 一 次 请 求 ， 其 中 状态 为 200 的 表示 成 
功 完成 请 求 ， 方 法 表示 HTTP 请 求 方法 (主要 是 GET 和 POST) 。 如 果 需 要 可 以 选择 具体 的 数 
据 类 型 ， 其 中 XHR 是 异步 请 求 ， 本 例 中 的 XHR 没有 请 求 信息 。 


Win aae] Rg 739.85 oso% &e2 an Asa | 
[ET 


| EL 


图 21-6 使 用 Web 工具 箱 


具体 分 析 时 可 以 先 查 看 HTML 数据 ， 如 图 21-7 所 示 ， 选 中 lshq.shtml 文件 ， 然 后 会 在 右 
边 打开 一 个 小 窗口 ， 选 择 响应 标签 可 以 查看 从 服务 器 返回 的 数据 ， 如 果 是 HTML 或 图 片 数据 ， 
则 可 以 预览 ， 响 应 载荷 中 的 内 容 就 是 返回 的 HIML 代码 。 若 要 验证 是 否 是 静态 数据 可 以 将 
HTML 代码 复制 出 来 ， 然 后 查找 关键 字 。 


G Cam Dews Om (mms Cus FF 二 RE Oe EELLLESE 
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图 21-7 HTML 数据 分 析 
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如 果 在 HTML 中 找 不 到 关键 字数 据 ， 则 说 明 是 动态 数据 ， 动 态 数据 可 以 查看 XHR 和 JS 。 
图 21-8 所 示 是 JS 数据 界面 ， 在 这 些 成 功 的 请 求 (状态 为 200 的 ) 中 逐一 查找 ， 这 个 过 程 没有 
什么 技巧 可 言 ， 只 能 靠 耐心 和 经 验 积累 。 图 21-8 所 示 界 面 中 找到 了 一 个 请 求 ， 它 的 响应 数据 
是 一 个 字符 串 ， 经 过 分 析 查 看 发 现 这 就 是 页 面 中 的 数据 。 选 择 表格 中 的 请 求 ， 右 击 菜单 中 选择 
“复制 ”一 “复制 网 址 ”， 复 制 出 来 的 网 址 如 下 : 


http://q.stock.sohu.com/hisHq?code=cn 600519&stat=1&order=D&period=d&cal1back= 
historySearchHandlergrt=jsonp&0.8115656498417958 


ELIELLES 
型 呈 qa 


图 21-8 JS 数据 分 析 


由 于 本 次 请 求 是 GET 请 求 ， 可 以 直接 将 网 址 在 浏览 器 中 打开 ， 如 图 21-9 所 示 。 浏 览 器 展 
示 了 一 个 字符 串 。 从 返回 的 字符 串 可 见 ， 这 并 不 是 一 个 有 效 的 JSON 数据 ， 而 JSON 数据 是 放 
置 在 historySearchHandler(.…) 中 的 ，historySearchHandler 应 该 是 一 个 JavaScript 变量 或 函数 ， 
开发 人 员 只 需要 关心 括号 中 的 JSON 字符 串 就 可 以 了 。 


[ec)> @ 会 © qstocksohu.com/hisHq?codo 器 日 … 个 
办 MW 国力 下 上 后 加 WE 


图 21-9 浏览 器 中 展示 返回 的 字符 串 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter21/ch21.2.2-2.py 


""" 获得 动态 数据 """ 
import re 


import urllib.request 
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url = 'http://q.stock.sohu.com/hisHq?code=cn 600519&stat=1&order=D&period=d&gcall 
back=historySearchHandlergrt=jsonp&0.8115656498417958" 


req = urllib.request.Request (url) 


with urllib.request.urlopen (req) as response: 
data = response.read() 
htmlstr = data.decode('gbk') 
print (htmlstr) 
htmlstr = htmlstr.replace('historySearchHandler(', '') 
htmlstr = htmlstr.replace(')', '') 
print (' 蔡 换 后 的 ，'， htmlstr) 


其 中 代码 第 @ 行 是 去 掉 historySearchHandler( 代码 第 @ 行 是 去 掉 后 面 的 ) 字符 串 。 最 后 获 
得 有 效 的 JSON 数据 ， 解 析 JSON 数据 的 过 程 这 里 不 再 次 述 。 

3. 伪装 成 浏览 器 

有 些 网 站 服务 器 提供 者 并 不 希望 上 月 候 虫 来 仆 数 据 (搜索 引擎 除外 )， 因 为 这 会 增加 服务 器 的 
负载 ， 占 用 服务 器 带宽 。 另 外 ， 这 些 数据 也 是 有 商业 价值 的 。 出 于 多 种 原因 ， 有 些 服务 器 会 检 
查 一 个 网 络 请 求 是 否 是 由 浏览 器 发 出 的 ， 本 书 之 前 使 用 urllib 发 送 的 网 络 请 求 ， 很 容易 被 服务 
器 识别 出 来 不 是 来 自 浏览 器 的 请 求 。 为 此 ， 可 以 将 urllib 发 送 请 求 进行 伪装 ， 伪 装 的 关键 是 要 
在 urllib 的 请 求 头 中 添加 User-Agent 字段 ”。 

下 面 示例 实现 了 将 urllib 请 求 伪装 成 为 iPhone 的 Safari 浏览 器 ， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter21/ch21.2.2-3.py 


四 
四 


import urllib.request 
url = "http://www.ctrip.com/ 


req = urllib.request.Request (url) 
req.add header('User-Agent', 
"Mozilla/5.0 (iPhone; CPU iPhone OS 10 2 1 like Mac OS X) AppleWebKit/ 
602.4.6 (KHTML, like Gecko) Version/10.0 Mobile/14D27 Safari/602.1') @ 


with urllib.request.urlopen (req) as response: 
data = response.read() 
htmlstr = data.decode() 
if htmlstr.find('mobile') != -1: 回 
print (' 移动 版 ') 
上 述 代码 第 @ 行 通过 Request 的 add_header( 方法 添加 请 求 头 ，User-Agent 设置 用 户 代 
理 字 段 ，Mozilla/5.0 (iPhone; CPU iPhone OS 10 2 1 like Mac OS X) AppleWebKit/602.4.6 
(KHTML, like Gecko) Version/10.0 Mobile/14D27 Safari/602.1 说 明 这 是 iPhone 的 Safari 浏 览 
器 发 出 的 请 求 。 请 求 发 出 后 需要 判断 返回 的 HTML 代码 是 否 是 专门 为 移动 平台 而 设计 的 ， 代 


@@ User-Agent 的 中 文 名 为 用 户 代理 , 它 是 一 个 特殊 字符 串 头 , 使 得 服务 器 能 够 识别 客户 使 用 的 操作 系统 及 版 本 、 
CPU 类 型 、 浏 览 器 及 版 本 、 浏 览 器 泻 染 引擎 、 浏 览 器 语言 、 浏 览 器 插件 等 。 
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码 第 @ 行 是 进行 验证 。 

请 求 头 可 以 包含 很 多 字段 ， 都 是 通过 add_header0 方法 添加 的 ， 其 中 第 一 个 参数 是 请 求 的 
字段 各， 这 个 名 字 是 固定 的 ， 第 二 个 参数 对 应 内 容 。 以 下 代码 是 通过 Firefox 浏览 器 发 送 的 一 
些 网 络 请 求 。 


User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:59.0) Gecko/20100101 
Firefox/59.0 
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Language: zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2 
Accept-Encoding: gzip, deflate 


除了 添加 请 求 头 信息 外 ，nurllib 请 求 还 可 以 添加 Cookies 信息。 
21.2.3 使 用 Selenium 疏 取 数据 


伪装 浏览 器 是 相对 而 言 的 ， 只 要 愿意 服务 器 总 是 有 办 法 识别 请 求 是 否 来 自 浏 览 器 。 另 外 ， 
有 的 数据 需要 登录 系统 后 才能 获得 ， 例 如 邮箱 数据 ， 而 且 在 登录 时 会 有 验证 码 识别 ， 验 证 码 能 
够 识别 出 是 人 工 登 录 系 统 ， 还 是 计算 机 程序 登录 系统 。 试 图 破解 验证 码 不 是 一 个 好 主意 ， 现 在 
的 验证 码 也 不 是 简单 的 图 像 ， 有 的 会 有 声音 等 识别 方式 。 

如 果 是 一 个 真正 的 浏览 器 ， 那 么 服务 器 设置 重重 “障碍 ”就 不 是 问题 了 。Selenium 可 以 启 
动 本 机 浏览 器 ， 然 后 通过 程序 代码 操控 它 。Selenium 直接 操控 浏览 器 ， 可 以 返回 任何 形式 的 动 
态 数据 。 使 用 Selenium 操控 浏览 器 的 过 程 中 也 可 以 人 为 干预 ， 例 如 在 登录 时 ， 如 果 需 要 输入 
验证 码 ， 则 由 人 工 输入 ， 登 录 成 功 之 后 ， 再 由 Selenium 操控 浏览 器 爬 取 数据 。 

1. 安装 和 配置 Selenium 

Selenium 的 官网 是 https://www.seleniumhq.org/， 可 以 通过 pip 安装 Selenium， 过 程 如 下 ， 
安装 指令 为 


pip install selenium 
在 Windows 平台 下 执行 pip 安装 指令 过 程 如 图 21-10 所 示 ， 最 后 会 有 安装 成 功 提示 ， 其 他 平台 
的 安装 过 程 也 是 类 似 的 ， 这 里 不 再 效 述 。 


CAWINDOWS\system: 


图 21-10 ”pip 安装 过 程 


Selenium 需要 操作 本 地 浏览 器 ， 默 认 是 Firefox， 因 此 比较 推荐 安装 Firefox 浏览 器 ， 本 例 
安装 的 Selenium 版 本 是 3.11.0， 要 求 Firefox 浏览 器 是 55.0 以 上 版 本 。 由 于 版 本 兼容 的 问题 还 
需要 下 载 浏 览 器 引擎 GeckoDriver，GeckoDriver 可 以 在 https://github.com/mozilla/geckodriver/ 


@ 某 些 网 站 为 了 辨别 用 户 身份 ， 将 一 些 数据 储存 在 用 户 本 地 计算 机 上 ， 这 些 数据 是 加 密 的 ， 这 些 Cookies 信息 
依赖 于 浏览 器 。 
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releases 下 载 ， 根 据 自 己 的 平台 选择 对 应 的 版 本 ， 
不 需要 安装 GeckoDriver， 只 需 将 下 载 包 解压 处 理 
就 可 以 了 。 

然后 需要 配置 环境 变量 ， 将 Firefox 浏览 器 的 
安装 目录 和 GeckoDriver 解压 目录 添加 到 系统 的 
PATH 中 ， 如 图 21-11 所 示 是 在 Windows 10 下 添 
加 了 PATH。 

2. Selenium 常用 API 

Selenium 操作 浏览 器 主要 通过 WebDriver 对 
象 实现 ，WebDriver 对 象 提供 了 操作 浏览 器 和 访问 
HTML 代码 中 数据 的 方法 。 

操作 浏览 器 的 方法 如 下 。 
refresh(): 刷新 网 页 。 
back(): 回 到 上 一 个 页 面 。 
forward(): 进入 下 一 个 页 面 。 
close(): 关闭 窗口 。 
quit(): 结束 浏览 器 执行 。 
get(url) : 浏览 url 所 指 的 网 页 。 
访问 HTML 代码 中 数据 的 方法 如 下 。 


find_element_by_id(id): 通过 元 素 的 id 查找 符合 条 件 的 第 一 
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find_elements_by_id(id): 通过 元 素 的 id 查找 符合 条 件 的 所 有 元 素 。 
find_element_by_name(name): 通过 元 素 名 字 查 找 符合 条 件 的 第 一 
find_elements_by_name(name): 通过 元 素 名 字 查 找 符合 条 件 的 所 有 元 素 。 
find_element_by_link_text(link_text): 通过 链接 文本 查找 符合 条 件 的 第 一 
find_elements_by_link_text(link_text): 通过 链接 文本 查找 符合 条 件 的 所 有 元 素 。 
find_element_by_tag_name(name): 通过 标签 名 查找 符合 条 件 的 第 一 个 元 素 。 
find_elements_by_tag_name(name): 通过 标签 名 查找 符合 条 件 的 所 有 元 素 。 


。find_element_by_xpath(xpath): 通过 XPath 查找 符合 条 件 的 第 一 个 元 素 。 


find_elements_by_xpath(xpath): 通过 XPath 查找 符合 条 件 的 所 有 元 素 。 
"find_element by_class_name(name): 通过 CSS 中 class 属性 查找 符合 条 件 的 第 一 


| 18) 
| Fo 
[aeem-| 
[2 
图 21-11 添加 PATH 
个 元 素 。 
个 元 素 。 
个 元 素 。 
个 元 素 。 


。find_elements_by_class_name(name): 通过 CSS 中 class 属性 查找 符合 条 件 的 所 有 元 素 。 


*» find element by_css_selector(css_selector) : 


元 素 。 


通过 CSS 中 选择 器 查找 符合 条 件 的 第 一 个 


。find_elements_by_css_selector(css_selector) : 通过 CSS 中 选择 器 查找 符合 条 件 的 所 有 


元 素 。 
另外 ， 还 有 一 些 常用 的 属性 如 下 。 
"current_ url: 获得 当前 页 面 的 网 址 。 
。page_source: 返回 当前 页 面 的 HIML 代码 。 
" title: 获得 当前 HTML 页 面 的 title 属性 值 。 
"text: 返回 标签 中 的 文本 内 容 。 


下 面 通过 一 个 示例 介绍 如 何 使 用 Selenium。 在 21.2.2 节 使 用 urllib 获得 搜狐 证 券 提 供 的 
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股票 历史 数据 是 非常 麻烦 的 事情 ， 原 因 是 这 些 数据 是 同步 动态 数据 。 而 使 用 Selenium 返回 这 
些 数据 是 非常 简单 的 。 首 先 需要 借助 于 Web 工具 箱 找到 显示 这 些 数据 的 HTML 标签 ， 如 图 
21-12 所 示 ， 在 Web 工具 箱 的 查看 器 中 ， 找 到 显示 页 面 表格 对 应 的 HTML 标签 ， 注 意 在 查看 
器 中 选中 对 应 的 标签 ， 页 面 会 将 该 部 分 灰色 显示 。 经 过 查找 分 析 最 终 找 到 一 个 table 标签 ， 复 
制 它 的 id 或 class 属性 值 ， 以 备 在 代码 中 进行 查询 。 
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图 21-12 Web 工具 箱 


示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter21/ch21.2.3.py 


from selenium import webdriver 
driver = webdriver.Firefox() 
driver.get ('http://q.stock.sohu.com/cn/600519/1shq.shtml') 


em = driver.find element by id('BIZ hq historySearch') 


print (em.text) 


Geee@e © © 


driver.quit() 


上 述 代码 第 @ 行 导入 了 Selenium 模块 。 代 码 第 @ 行 创建 了 Firefox 浏览 器 使 用 的 Webdriver 
对 象 ， 不 同 的 浏览 器 初始 化 方法 不 同 ，Selenium 支持 主流 浏览 器 ， 也 包括 移动 平台 浏览 器 。 
Selenium 对 于 Firefox 浏览 器 的 支持 是 最 好 的 。 代 码 第 @@ 行 通过 get0 方法 打开 网 页 ， 此 时 程序 会 
启动 Firefox 浏览 器 并 打开 网 页 。 代 码 第 图 行 是 通过 id 查找 元 素 ，BIZ_hq_historySearch 是 table 
标签 的 id 属性 ， 如 果 采 用 class 属性 查找 可 以 使 用 fnd_element by_class_name0 方法 。 代 码 第 @ 
行 是 取出 table 标签 中 所 有 文本 ， 并 打印 输出 。 代 码 第 @ 行 是 退出 浏览 器 。 

代码 运行 结果 如 下 。 


第 21 章 项 目 实战 1， 网 络 候 虫 与 公 取 股票 数据 | 苏 319 


日 期 开盘 收盘 涨 跌 额 涨 跌幅 最 低 最 高 成 交 量 ( 手 ) 成 交 金额 ( 万 ) 换 手 率 

累计 : 2017-11-17 至 2018-03-16 20.74 2.88% 613.01 799.06 4583420 32325823.44 36.47% 
2018-03-16 747.60 739.85 -6.62 -0.89% 738.88 753.98 35856 267668.25 0.29% 
2018-03-15 728.02 746.47 19.59 2.70% 728.02 747.00 56149 416164.59 0.45% 


2017-11-17 696.00 690.25 -28.86 -4.01% 677.77 709.00 123861 854874.75 0.99% 


在 运行 示例 过 程 中 ， 会 发 现 浏 览 器 打开 网 页 后 ， 相 对 经 过 较 长 时 间 才 返回 数据 。 这 是 因为 
它 要 等 待 所 有 的 请 求 结束 之 后 ， 才 返回 数据 ， 包 括 那 些 异 步 请 求 的 数据 ， 这 也 是 为 什么 使 用 
Selenium 能 返回 动态 数据 的 原因 。 


21.3 ”分析 数据 


息 取 数据 之 后 就 可 以 分 析 数 据 了 ， 应 根据 仆 回 的 数据 格式 选择 不 同 的 数据 分 析 方 法 ， 本 节 加 
重点 介绍 分 析 HTML 代码 获取 的 数据 。 : 


21.3.1 使 用 正则 表达 式 人 


数据 分 析 最 御 的 办 法 就 是 通过 字符 串 的 查找 、 截 取 等 方法 实现 ， 但 是 这 样 工作 量 太 大 。 可 
以 使 用 正则 表达 式 ， 正 则 表达 式 功能 强大 ， 但 技术 难点 在 于 编写 合适 的 正则 表达 式 。 

图 21-13 所 示 的 页 面 是 中 国 天 气 网 站 图 片 频 道 ， 网 址 是 http://p.weather.com.cn/， 如 果 想 
息 取 这 个 网 站 中 的 图 片 ， 那 么 分 析 HTML 代码 可 知 ， 图 片 是 放置 在 img 标签 中 的 ，img 标签 
的 src 属性 是 指定 图 片 网 址 。img 标签 代码 如 下 : 


<img 
src="http://pic.weather.com.cn/images/cn/photo/2018/03/13/13083356B0C99CBECEAB2E 
0312AF4229E40A3999.jpg"> 


要 匹配 查找 src 中 的 图 片 网 址 有 两 种 思路 ， 一 种 是 查找 img 标签 ， 再 查找 src 属性 ， 另 一 
种 是 直接 查找 “ http:// ”开始 到 “ .png ”或 “ .jpg ”结尾 的 字符 串 。 本 例 中 采用 第 二 种 方式 查 
找 匹 配 的 字符 串 。 


图 21-13 中国 天 气 网 站 图 片 频道 
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示例 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter21/ch21.3.1.py 


import urllib.request 


import os 
import re 


url = 'http://p.weather.com.cn/' 


def findallimageurl (htmlstr): 
""" 从 HTML 代码 中 查找 匹配 的 字符 串 """ 


# 定义 正则 表达 式 
pattern = r'http://\S+(?:\.pngl\.jpg)"' 
return re.findall (pattern, htmlstr) 


def getfilename (urlstr): 


""" 根据 图 片 链接 地 址 截取 图 片 名 """ 


pos = urlstr.rfind('/') 
return urlstr[pos + 1:] 


# 分 析 获 得 的 url 列表 

url list = [] 

req = urllib.request.Request (url) 

with urllib.request.urlopen (req) as response: 
data = response.read() 
htmlstr = data.decode() 


url list = findallimageurl (htmlstr) 


for imagesrc in url list: 
# 根据 图 片 地 址 下 载 
req = urllib.request.Request (imagesrc) 
with urllib.request.urlopen (req) as response: 
data = response.read() 
# 过 滤 掉 小 于 10KB 的 图 片 
if len(data) < 1024 * 100: 


continue 


# 创建 download 文件 夹 
if not os.path.exists('download') : 


os.mkdir ('download') 


# 获得 图 片 文件 名 


©o 
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filename = getfilename (imagesrc) 


filename 'download/' + filename 


# 保存 图 片 到 本 地 
with open (filename, 'wb') as f: © 
f.write (data) 


print (' 下 载 图 片 '，filename) 


上 述 代码 第 @ 行 定义 了 正则 表达 式 ， 该 正则 表达 式 能 够 查找 “ http:// ”开始 到 “ .png ”或 
“jpg ”结尾 的 字符 串 ， 正 则 表达 式 中 (?:\pngl\jpg) 是 匹配 .png 或 .jpg 结尾 的 字符 串 。 代 码 第 
加 行 是 通过 re.findall(pattern, htmlstr) 查询 所 有 符合 条 件 的 字符 串 。 

代码 第 @ 行 循环 遍历 图 片 地 址 列表 url_list， 然 后 逐一 下 载 图 片 ， 由 于 想 下 载 大 图 ， 所 以 在 
代码 第 @ 行 过 滤 掉 小 于 100KB 的 图 片 。 代 码 第 @ 行 以 二 进 制 写 入 方式 打开 文件 ， 最 后 写 入 数据 。 

21.3.2 ”使 用 BeautifulSoup 库 

使 用 正则 表达 式 分 析 数 据 的 难点 在 于 编写 正则 表达 式 。 如 果 不 擅长 编写 正则 表达 式 可 
以 使 用 BeautifulSoup 库 帮 助 分 析 数 据 。BeautifulSoup 可 以 帮助 程序 设计 师 解 析 网 页 结构 ， 
BeautifulSoup 官网 是 https://www.crummy.com/software/BeautifulSoup/。 


1. 安装 BeautifulSoup 
BeautifulSoup 可 以 通过 pip 安装 进行 安装 ，pip 指令 如 下 : 


pip install beautifulsoup4 


在 Windows 平台 下 执行 pip 安装 指令 的 过 程 如 图 21-14 所 示 ， 最 后 会 有 安装 成 功 提示 ， 其 他 平 
台 安 装 过 程 也 是 类 似 的 ， 这 里 不 再 獒 述 。 


国 cCNWNDowswystemazemdexe 0 


图 21-14 ”pip 安装 过 程 


2. BeautifulSoup 常用 API 

BeautifulSoup 中 主要 使 用 的 对 象 是 BeautifulSoup 实例 ，BeautifulSoup 常用 方法 如 下 。 
。find_all(tagname): 根据 标签 名 返回 所 有 符合 条 件 的 元 素 列表 。 

。find(tagname): 根据 标签 名 返回 符合 条 件 的 第 一 个 元 素 。 

。 select(selector): 通过 CSS 中 选择 器 查找 符合 条 件 的 所 有 元 素 。 

。 get(key, default=None): 获取 标签 属性 值 ，key 是 标签 属性 名 。 

BeautifulSoup 常用 属性 如 下 。 

。title: 获得 当前 HTML 页 面 的 title 属性 值 。 
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"text: 返回 标签 中 的 文本 内 容 。 
21.3.1 节 的 示例 可 以 使 用 BeautifulSoup 重 构 ， 示 例 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 chapter21/ch21.3.2.py 


import os 


import urllib.request 
from bs4 import BeautifulSoup [oy 


url = "http://p.weather.com.cn/' 


def findallimageurl (htmlstr): 
""" 从 HTML 代码 中 查找 匹配 的 字符 串 """ 


sp = BeautifulSoup (htmlstr, 'html.parser') 
# 返回 所 有 的 img 标签 对 象 
imgtaglist = sp.find all('img') 


# 从 img 标签 对 象 列表 中 返回 对 应 的 src 列表 
srclist = list(map(lambda u: u.get('src'), imgtaglist)) @ 
# 过 滤 掉 非 .png 和 .jpg 结尾 文件 src 字符 串 
filtered srclist = filter(lambda u: u.lower().endswith('.png') 
or u.lower().endswith('.jpg'), srclist) 回 


return filtered srclist 


def getfilename (urlstr): 
""" 根据 图 片 链接 地 址 截取 图 片 名 """ 


pos = urlstr.rfind('/') 
return urlstr[pos + 1:] 


# 分 析 获 得 的 url 列表 

url list = [] 

req = urllib.request.Request (url) 

with urllib.request.urlopen(req) as response: 
data = response.read() 
htmlstr = data.decode() 


url list = findallimageur] (htmlstr) 


for imagesrc in url list: 
# 根据 图 片 地 址 下 载 
req = urllib.request .Request (imagesrc) 
with urllib.request.urlopen (req) as response: 


data = response.read() 
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# 过 滤 掉 小 于 100KB 的 图 片 
if len(dqata) < 1024 * 100: 


Continue 


# 创建 download 文件 夹 
if not os.path.exists('download') : 


os .mkdir('download') 


# 获得 图 片 文件 名 

filename = getfilename (imagesrc) 

filename = "download/' + filename 

# 保存 图 片 到 本 地 

with open (filename, 'wb') as f: 
f.write (data) 


print (' 下 载 图 片 '，filename) 


上 述 代码 第 @ 行 是 导入 BeautifulSoup 库 ， 注 意 其 中 bs4 是 模块 名 。 代 码 第 @@ 行 创建 了 
BeautifulSoup， 构 造 方法 第 一 个 参数 htmlstr 是 要 解析 的 HTML 代码 ， 第 二 个 参数 是 解析 器 ， 
可 以 使 用 的 解析 器 有 以 下 4 个 。 

。html.parser : Python 编写 的 解析 器 ， 速 度 比较 快 ， 支 持 Python 2.7.3 和 Python 3.2.2 以 

上 版 本 。 

。1lxml: C 编写 的 解析 器 ， 速 度 很 快 ， 依 赖 于 C 库 。 如 果 是 CPython 环境 可 以 使 用 该 解析 器 。 

。 lxml-xml: C 编写 的 XML 解析 器 ， 速 度 很 快 ， 依 赖 于 C 库 。 

，html5lib: HTML5 解析 器 。 

综合 各 方面 考虑 ，html.parser 是 不 错 的 选择 ， 它 通过 牺牲 速度 换取 了 兼容 性 。 

代码 第 @ 行 是 通过 find_all0 方法 查询 所 有 的 img 标签 元 素 。 代 码 第 @ 行 使 用 了 map0 函 
数 从 img 标签 对 象 列表 中 返回 对 应 的 src 对 象 列表 ， 其 中 使 用 了 lambda 表达 式 ， 表 达 式 中 的 
是 输入 对 象 标签 对 象 )，u.get('src) 是 取出 标签 的 src 属性 。 代 码 第 @ 行 的 fter() 函数 用 来 过 
滤 ， 保 留 那 些 .png 和 .jpg 结尾 的 src 字符 串 ， 该 函数 也 使 用 了 lambda 表达 式 。 


21.4 项 目 实战 : 谎 取 纳 斯 达 克 股 票数 据 


本 节 将 介绍 一 个 完整 的 网 络 怜 虫 项 目 ， 该 项 目 是 从 纳 斯 达 克 网 站 疏 取 苹果 公司 股票 数据 ， 园 


然后 进行 分 析 ， 分 析 之 后 的 结果 保存 到 数据 库 中 ， 以 备 以 后 使 用 。 


21.4.1 已 取 数 据 
的 取 纳 斯 达 克 网 站 的 苹果 公司 股票 数据 在 21.2.2 节 已 经 介绍 ， 这 里 不 再 袭 述 。 


21.4.2 ”检测 数据 是 否 更 新 


由 于 网 络 怜 虫 需要 定期 从 网 页 上 怜 取 数 据 ， 但 是 如 果 网 页 中 的 数据 没有 更 新 ， 本 次 稚 取 的 
数据 与 上 次 一 样 ， 就 没有 必要 进行 分 析 和 存储 了 。 验 证 两 次 数据 是 否 完 全 相同 可 以 使 用 MD5” 
数字 加 密 技 术 ，MD5 可 以 对 任意 长 度 的 数据 进行 计算 ， 得 到 固定 长 度 的 MD5 码 。MD5 的 典 


@ MD5 (Message Digest Algorithm， 消 息 摘要 算法 第 五 版 ) 为 计算 机 安全 领域 广泛 使 用 的 一 种 加 密 算法 。 


扫 码 看 视频 
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型 应 用 是 对 一 段 数据 产生 信息 摘要 ， 以 防止 被 算 改 。 通 过 MD5 函数 对 两 次 请 求 返回 的 HTML 
数据 进行 计算 ， 生 成 的 MD5 相同 则 说 明 数 据 没 有 更 新 ， 和 否则 数据 已 经 更 新 。 

了 Python 中 计算 MD5 码 可 以 使 用 hashlib 模块 中 的 md50 函数 。 实 现 检测 数据 更 新 的 代码 
如 下 : 


# coding=utf-8 
# 代码 文件 : chapter21/ch21.4.2.py 


""" 项 目 实战 : 怜 取 纳 斯 达 克 股 票数 据 """ 
import urllib.request 

import hashlib 

from bs4 import BeautifulSoup 


import os 


url = 'https://www.nasdaq.com/symbol/aapl/historical#.UWdnJBDMhHKk' 


def validateUpdate (html): 
""" 验证 数据 是 否 更 新 ， 更 新 返回 True， 未 更 新 返回 False""" 


# 创建 md5 对 象 

md5obj = hashlib.md5() 

md5obj .update (html.encode (encoding='utf-8')) 
md5code = md5obj.hexdigest() 

print (md5code) 


@@e 


old md5code = "1 
f_ name = "md5.txt" 


if os.path.exists(f_name): # 如 果 文件 存在 则 读 取 文 件 内 容 
with open(f_name， 'r', encoding="'utf-8') as f: 
old md5code = f.read() 


© @ © 


if md5code == old md5code: 
Print (' 数据 没有 更 新 ') 


return False 


E) 


else: 
# 把 新 的 md5 码 写 入 到 文件 中 
with open(f name, 'w', encoding="'utf-8') as f: 
f.write (md5code) 
print (' 数据 更 新 ' ) 


return True 
req = urllib.request.Request (url) 
with urllib.request.urlopen (req) as response: 


data = response.read() 
html = data.decode() 
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sp = BeautifulSoup (html, ‘'html.parser') 


# 返回 指定 CSS 选择 器 的 div 标签 列表 

div = sp.select ('div#quotes content left pnlAJAX') 
# 从 列表 中 返回 第 一 个 元 素 

divstring = div[0] 


if validateUpdate (divstring) : # 数据 更 新 
pass 
# TODO 分 析 数 据 
# TODO 保存 数据 到 数据 库 


上 述 代码 第 Q@ 行 ~ 第 @ 行 是 生成 MD5 码 的 主要 语句 。 首 先 通 过 代码 第 @ 行 md50) 函数 创 
建 md5 对 象 。 代 码 第 @ 行 使 用 update() 方法 对 传 入 的 数据 进行 MD5 运算 ， 注 意 update() 方法 
的 参数 是 字 节 序列 对 象 ， 而 html.encode(encoding='utf-8") 是 将 字符 串 转换 为 字 节 序 列 。 代 码 第 
@ 行 是 请 求 MD5 摘要 ，hexdigest() 方法 返回 一 个 十 六 进 制 数字 所 构成 的 MD5 码 。 

代码 第 图 行 定义 变量 f name， 用 来 保存 上 次 MD5 码 的 文件 名 。 代 码 第 @ 行 判断 文件 是 否 
存在 ， 如 果 存 在 则 会 读 取 MD5 码 ， 见 代码 第 @ 行 。 

代码 第 @ 行 是 比较 两 次 的 MD5 码 ， 如 果 一 致 说 明 没 有 更 新 ， 返 回 False ; 否则 返回 True， 
并 将 新 的 MD5 码 写 入 到 文件 中 ， 见 代码 第 @ 行 。 


提示 : 传 入 给 MD5 函数 的 字符 串 应 该 是 哪些 字符 串 呢 ? 如 果 传 入 整个 网 页 的 HTML 字符 
串 ， 即 便 是 股票 数据 并 没有 更 新 ， 计 算 的 结果 往往 也 是 一 致 的 。 这 是 因为 整个 页 面 的 HTML 
代码 中 还 有 一 些 其 他 变化 的 数据 。 所 以 传 入 的 字符 串 最 好 是 衷 挟 着 要 爬 取 数 据 的 HTML 字 
符 串 ， 如 图 21-15 所 示 的 div 标签 中 衷 兵 了 所 需要 的 股票 数据 。 为 了 获得 div 标签 的 HTML 
字符 串 ， 需 要 使 用 BeautifulSoup 进行 解析 ， 见 代码 第 四 行 ，select() 方法 通过 CSS 选择 器 
div#quotes_content_left pnlAJAX 返回 div 标签 HTML 字符 串 。 


Report No Apple Inc iPhone SE Repecn in 
ne FrtHarof2018 


日 -加 日 全 口 驯 X 


图 21-15 右 挟 数据 的 HTML 字符 串 
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提示 : 如 何 获得 一 个 标签 的 CSS 选择 器 呢 ? 可 以 在 Web 工具 箱 的 查看 器 窗口 中 选择 标签 ， 
右 击 菜单 中 选择 “复制 ”一 “CSS 选择 器 ”或 “CSS 路 径 ”。 


21.4.3 ”分 析 数 据 
分 析 数 据 的 前 提 需 要 数据 已 经 更 新 ，validateUpdate() 函数 返回 True， 然 后 才能 进行 数据 


分 析 。 相 关 代 码 如 下 : 
if validateUpdate (divstring): # 数据 更 新 

# 分 析 数 据 

trlist = sp.select('div#quotes content left pnlAJAX table tbody tr') [0 

data = [] 

for tr in trlist: @ 
trtext = tr.text.strip('\n\r ') @ 
EE rtent we 合生 @ 

continue 

rows = re.split(r'\st+', trtext) 
fields = {} 
fields['Date'] = rows[0] 
fields['Open'] = foat(rows[1]) 
fields['High'] = float (rows[2]) 
fields['Low'] = float (rows[3]) 
fields['Close'] = float (rows[4]) 
fields['Volume'] = int(rows[5] .replace(',', '')) 加 


data.append (fields) 
print (data) 
# TODO 保存 数据 到 数据 库 


上 述 代 码 再 次 使 用 了 BeautifulSoup 的 select() 方 法 ， 其 中 CSS 选择 器 是 div#quotes_ 
content_left_pnlAJAX table tbody tr， 该 选择 器 指向 div 一 table 一 tbody 一 tr 标签， 如 图 21-16 
所 示 。 

代码 第 @ 行 遍历 了 fr 列表 trlist。 代 码 第 @ 行 中 trtext 是 取出 标签 中 的 所 有 文本 ，strip(\n\r ) 
是 字符 串 函 数 ， 可 以 删除 字符 串 前 后 的 特定 字符 串 ， 本 例 是 删除 字符 串 前 后 的 换行 符 、 回 车 符 
和 空格 。 删 除 这 些 字 符 串 之 后 应 该 判断 一 下 是 否 为 空 字符 串 ， 见 代码 第 田 行 ， 如 果 是 空 字符 串 
需要 跳 过 后 面 代码 ， 继 续 下 一 次 循环 。 

为 了 分 隔 字符 串 ， 要 用 到 正则 表达 式 的 split() 函数 ， 见 代码 第 @ 行 ， 正 则 表达 式 \s+' 可 以 
匹配 任意 形式 的 空格 ， 包 括 回 车 符 、 换 行 符 、 制 表 符 都 可 以 匹配 。 

代码 第 @ 行 定义 了 一 个 字典 ， 每 一 行 数据 都 放 到 这 个 字典 对 象 中 ， 再 将 字典 对 象 放 到 一 个 
列表 中 。 代 码 第 @ 行 中 rows[5].replace(','，' ') 是 剔除 掉 字符 串 中 的 逗号 “ ,”， 这 是 为 了 方 
便 转 换 为 整数 。 
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图 21-16 CSS 选择 器 路 径 


21.4.4 保存 数据 到 数据 库 


数据 分 析 完成 后 需要 保存 到 数据 库 中 。 该 项 目的 数据 库 设计 模型 如 图 21-17 所 示 ， 项 目 中 
包含 两 个 数据 表 ， 股 票 信息 表 (Stocks) 和 股票 历史 价格 表 (HistoricalQuote) 。 


HistoricalQuote | 
HDate gd 


<pk> 


Open decimal (8, 4) 

So High 。 decimal(8, 4) 
- Low decimal(8,4) 
和 一 Close decimal (8, 4) 
Company 


Volume bigint 
Symbol varchar(10) 《fk> 


Industry varc ar (10) 
图 21-17 数据 库 设 计 模 型 
对 数据 库 设计 模型 中 各 个 表 说 明 如 下 。 
1) 股票 信息 表 
股票 信息 表 (Stocks) 是 纳 斯 达 克 股 票 ， 股 票 代号 〈SymboD 是 主键 ， 股 票 信息 表 结 构 如 
表 21-1 所 示 。 该 项 目 目 前 的 功能 不 包括 维护 股票 信息 表 ， 所 以 股票 信息 表 中 的 数据 在 创建 数 
据 表 时 是 预先 插入 的 。 


表 21-1 股票 信息 表 


字 段 名 数据 类 型 备注 
Symbol varchar(10) 股票 代号 
Company varchar(50) 公司 

Industry varchar(10) 所 属 行业 


2) 股票 历史 价格 表 


股票 历史 价格 表 (HistoricalQuote) 是 某 一 只 股票 的 历史 价格 表 ， 交 易 日 期 (HDate) 是 主 
键 ， 股 票 历史 价格 表 结 构 如 表 21-2 所 示 。 
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表 21-2 股票 历史 价格 表 


字 段 名 数据 类 型 外 键 备 注 
HDate date 否 交易 日 期 
Open decimal(8,4) 否 开盘 价 
High decimal(8,4) 否 最 高 价 
Low decimal(8,4) 否 最 低 价 
Close decimal(8.4) 否 收盘 价 
Volume bigint 否 成 交 量 
Symbol varchar(10) 是 股票 代号 


数据 库 设计 完成 后 需要 编写 数据 库 DDL 脚本 。 当 然 ， 也 可 以 通过 一 些 工 具 生 成 DDL 肢 
然后 把 这 个 脚本 放 在 数据 库 中 执行 就 可 以 了 。 下 面 是 编写 的 DDL 脚本 文件 crebas.sql。 


/*= 
/* 股票 信息 数据 库 DDL 脚本 
代码 \chapter21\21.4\db\crebas.sql 


/* 创建 数据 库 */ 


create database if not exists NASDAQ; 


use NASDAQ; 


drop table if exists HistoricalQuote; 


drop table if exists Stocks; 


/* Table: HistoricalQuote 


create table HistoricalQuote 


( 


HDate date not null, 
Open decimal (8,4), 
High decimal (8,4), 
Low decimal (8,4), 
Close decimal (8,4), 
Volume bigint, 
Symbol varchar (10), 


primary key (HDate) 


/*=: 
/* Table: Stocks 
/*= 
create table Stocks 


( 


a 
人 


“六 


有 
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Symbol varchar (10) not null, 
Company varchar (50) not null, 
Industry varchar (10) not null, 


primary key (Symbol) 


alter table HistoricalQuote add constraint FK Reference 1 foreign key (Symbol) 
references Stocks (Symbol) on delete restrict on update restrict; 


insert into Stocks (Symbol, Company, Industry) values ('AAPL', 'Rpple Inc.', 
'Technology'); O 


在 创建 完成 数据 库 后 ， 还 在 股票 信息 表 中 预先 插入 了 一 条 数据 ， 见 代码 第 中 行 。 编 写 
DDL 脚本 之 后 需要 在 MySQL 数据 中 执行 ， 创 建 数据 库 。 
数据 库 创建 完成 后 ， 编 写 访问 数据 库 的 Python 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter21/21.4/db/db_access.py 


import pymysql 


def insert hisq datal(row): 


""" 在 股票 历史 价格 表 中 传 入 数据 """ 


# 1。 建立 数据 库 连 接 

connection = pymysql.connect (host='localhost', 
user='root', 
password="'12345', 
database='nasdaqg', 
charset='utf8') 

try: 

# 2。 创建 游 标 对 象 


with connection.cursor() as cursor: 


# 3。 执行 SQL 操作 
sql = "insert into historicalquote ' \ 
' (HDate, Open, High, Low,Close,Volume, Symbol)' \ 


' values 
(S$(Date)s,% (Open)s,% (High)s, (Low)s,% (Close)s,%(Volume)s,%(Symbol)s)' [oy 
affectedcount = cursor.execute (sql, row) © 


print (' 影响 的 数据 行 数 : {0}' .format (affectedcount)) 
# 4。 提交 数据 库 事务 


connection commit () 


# with 代码 块 结束 5. 关闭 游标 
except pymysql.DatabaseError as error: 


# 4. 回 深 数 据 库 事务 


330 者 | Python 从 小 白 到 大 牛 


connection.rollback() 
Print (error) 

finally: 
# 6。 关闭 数 据 库 连接 


connection.close() 
访问 数据 库 代码 是 在 db_access 模块 中 编写 的 。 代 码 第 @ 行 是 插入 数据 SQL 语句 ， 其 中 
(%(Date)s 等 是 命名 占 位 符 ， 绑 定时 需要 字典 类 型 。 代 码 第 @ 行 是 绑 定 参数 并 执行 SQL 语句 ， 
其 中 row 是 要 绑 定 的 参数 ，row 是 字典 类 型 。 
调用 db_access 模块 代码 如 下 : 


# coding=utf-8 
# 代码 文件 chapter21/21.4/ch21.4.4.py 


data = [] 


< 省 略 分 析 数据 代码 > 

# 保存 数据 到 数据 库 

for row in data: @ 
row['Symbol'] = 'AAPL' @ 
insert hisq data (row) 加 


上 述 代码 第 @ 行 是 循环 遍历 data 变量 ，data 保存 了 所 有 怜 虫 疏 取 的 数据 。 代 码 第 @@ 行 添加 
Symbol 到 row 中 ， 扑 取 的 数据 没有 Symbol。 代 码 第 @ 行 是 调用 db_access 模块 的 insert_hisq_ 
data() 函数 插入 数据 到 数据 库 。 


21.4.5 ”让 虫 工作 计划 任务 


网 络 中 的 数据 一 般 都 是 定期 更 新 的 ， 网 络 爬 虫 不 需要 一 直 工 作 ， 可 以 根据 数据 更 新 频率 或 
更 新 数据 时 间 点 ， 制 订 网 络 怜 虫 工作 计划 任务 。 例 如 股票 信息 在 交易 日 内 是 定时 更 新 的 ， 纳 斯 
达 克 股 票 交易 日 是 周一 至 周 五 ， 当 然 还 有 特殊 的 日 期 不 进行 交易 ， 纳 斯 达 克 股 票 交易 时 间 是 美 
国 东部 夏令 时 间 上 午 9:30~ 下 午 3:30， 冬 令 时 间 上 午 10:30~ 下 午 4:30。 本 项 目 有 些 特殊 疏 取 
的 数据 不 是 实时 数据 ， 而 是 历史 数据 ， 这 种 历史 数据 应 该 在 交易 日 结束 之 后 假 取 。 

本 项 目 需要 两 个 子 线程 ， 一 个 是 工作 子 线程 ， 另 一 个 是 控制 子 线程 。 具 体 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter21/ch21.4.5-end.py 


""" 项 目 实战 .让 取 纳 斯 达 克 股 票数 据 """ 
import datetime 

import hashlib 

import logging 

import os 

import re 

import threading 

import time 


import urllib.request 


from bs4 import BeautifulSoup 


更 
示 
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from db.db access import insert hisq data 


logging.basicConfig (level=logging.INFO, 


format='gs(asctime)s - $(threadName)s - " 


"gs (name)s - %(funcName)s - $(levelname)s - %(message)s') 


logger = logging.getLogger( name ) 


# 线程 运行 标志 


isrunning = True 
# 疏 虫 工作 间隔 


interval = 5 


def 


def 


def 


controlthread body() : 
"ww 控制 线程 体 函数 """ 


global interval, isrunning 


while isrunning: 


# 控制 疏 虫 工作 计划 


i = input(' 输入 Bye 终止 朴 虫 ， 输 入 数字 改变 疏 虫 工作 间隔 ， 单 位 秒 : 


1ogger.info(' 控制 输入 {0}' .format (i)) 
try: 
interval = int(i) 
except ValueError: 
if i.lower() == 'bye': 
isrunning = False 


istradtime(): 


判断 工作 时 间 """ 


now = datetime.datetime.now() 

df = "sHSMSS 

strnow = now.strftime (df) 

starttime = datetime.time(9, 30) .strftime (df) 
endtime = datetime.time(15, 30) .strftime (df) 


if now.weekday() == 5 \ 
or now.weekday() == 6 \ 
or (strnow < starttime or strnow > endtime): 
# 非 工 作 时 间 
return False 
# 工作 时 间 


return True 


workthread body() : 
""" 工作 线程 体 函数 """ 


办 
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global interval, isrunning 
while isrunning: 


if istradtime() : @ 
# 交易 时 间 内 不 工作 
logger.info(' 交易 时 间 ， 扑 虫 休眠 1 小 时 . . . ') 
time.sleep(60 * 60) 


continue 
logger.info(' 爬虫 开始 工作 ..."') 
< 省 略 分 析 数 据 和 保存 数据 到 数据 库 代码 > 


# 疏 虫 休眠 
logger.info(' 疏 虫 休眠 {0} 秒 ...'.format (interval)) 
time.sleep (interval) ! 


def main(): 


“mn 主 孜 孝 wo 


global interval, isrunning 

# 创建 工作 线程 对 象 workthread 

workthread = threading.Thread (target=workthread body, name='WorkThread') @ 
# 启动 线程 workthread 

workthread.start () 


# 创建 控制 线程 对 象 controlthread 

controlthread = threading.Thread (target=controlthread body, name= 
"ControlThread') # 

# 启动 线程 controlthread 

controlthread.start () 


if _name == ' main_': 


main() 


上 述 代 码 第 @ 行 是 创建 工作 线程 对 象 workthread， 工 作 线 程 根据 指定 计划 任务 完成 分 析 
数据 和 数据 保存 。 工 作 线程 启动 后 会 调用 代码 第 @ 行 的 线程 体 函数 ， 在 线程 体 函 数 中 代码 第 @ 
行 调用 了 istradtime() 函数 判断 是 否 是 交易 时 间 ， 如 果 是 交易 时 间 ， 则 休眠 1 小 时 。 疏 虫 完成 
一 轮 工 作 后 ， 需 要 休眠 一 段 时 间 ， 见 代码 第 ! 行 ，interval 变量 是 休眠 时 间 ， 这 个 变量 是 由 另 
外 一 个 线程 控制 子 线程 控制 的 。 

代码 第 # 行 是 创建 控制 线程 对 象 controlthread， 控 制 线程 从 控制 台 输 入 字符 串 ， 控 制 变 
量 interval 和 isrunning。 变 量 interval 是 仆 虫 的 休眠 时 间 ， 代 码 第 @@ 行 定义 变量 interval ; 变 
量 isrunning 是 两 个 子 线程 结束 标识 ， 代 码 第 Q@ 行 定义 变量 isrunning。 控 制 线程 启动 后 会 调用 
代码 第 @ 行 的 线程 体 函数 ， 在 线程 体 函 数 中 代码 第 @ 行 是 从 控制 台 输 入 字符 串 。 代 码 第 @@ 行 
修改 变量 interval， 如 果 输 入 的 不 是 一 个 整数 ， 则 判断 输入 的 字符 串 是 否 为 bye, 如 果 是 则 修改 
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isrunning 为 False， 见 代码 第 @ 行 。 


另外 ， 代 码 第 @ 行 是 判断 交易 的 时 间 函 数 ， 该 函数 可 以 判断 当前 时 间 是 否 是 股票 交易 时 
间 。 代 码 第 @ 行 中 now.weekday( == 5 是 判断 当前 日 期 是 星期 六 ，now.weekday0 一 6 是 判断 
当前 日 期 是 星期 日 ，strnow < starttime or strnow > endtime 是 判断 当前 时 间 是 在 上 午 9:30~ 下 


午 3:30 时 间 段 。 


提示 : 本 项 目的 判断 工作 时 间 函 数 istradtime() 还 需要 完善 。 为 了 测试 和 容易 学 习 ， 上 述 
代码 实现 依照 了 北京 时 间 ， 如 果 读者 感 兴趣 可 以 修改 为 美国 东部 时 间 ， 而 且 要 注意 夏令 时 和 冬 
令 时 。 另 外 ， 非 交易 日 只 考虑 星期 六 和 星期 日 ， 特 殊 日 期 也 是 非 交易 日 ， 例 如 国庆 日 、 圣 诞 节 


等 ， 这 些 需 要 参考 美国 节假日 。 


项 目 编写 完成 后 就 可 以 进行 测试 了 。 图 21-18 是 项 目的 控制 台 ， 如 果 在 控制 台 输 入 数值 
则 控制 仆 虫 的 休眠 时 间 ; 如 果 输 入 的 是 字符 串 bye， 则 结束 两 个 子 线程 ， 整 个 工程 也 结束 。 


C:\Users\win-mini\AppData\Local\Programs\Python\Python36\python.exe 


输入 Bye 终 止 让 虫 ， 输 入 数字 改变 让 虫 工作 间隔 ， 单 位 秒 : 2618-63-18 11:41:53,558 - Worki 本 甩 5 秒 国 

- workthread_body - INFO - 展 虫 开始 工 四 

2618-63-18 11:41:55,358 - WorkThread - __main_”- validateUpdate - INFO - 数据 更 
CC - main - workthread_body - INFO CR 由 休 眼 5 秒 . 

了 9 


2618-63-18 11:42:61,928 - WorkThread - - 
-18 kThread - 


bye 


03-18 11:42:09, ~ ControlThread - __main__ - controlthread_body - INFO -| 控制 答 入 bye 


Process finished with exit code © 


图 21-18 项 目 控制 台 


回 
扫 码 看 视频 


项 目 实战 2: 数据 可 视 化 与 


人 2 股票 数据 分 析 


大 量 的 数据 中 蕴藏 着 丰富 的 信息 ， 如 果 能 够 让 这 些 数据 清晰 地 、 友 好 地 、 漂 亮 地 展示 出 
来 ， 那 么 你 就 可 能 会 发 现 这 些 信息 。 例 如 股票 的 数据 量 很 大 ， 但 通过 股票 的 K 线 图 能 够 看 出 
股票 的 走势 ， 从 而 帮助 你 下 决定 。 本 章 将 通过 股票 数据 分 析 项 目 实战 介绍 Python 绘制 图 表 库 
Matplotlib 。 


22.1 使 用 Matplotlib 绘制 图 表 


Matplotlib (https://matplotlib.org/) 是 一 个 支持 Python 的 2D 绘图 库 ， 它 可 以 绘制 各 种 形 
式 的 图 表 ， 从 而 使 数据 可 视 化 ， 便 于 进行 数据 分 析 。 
Matplotlib 可 以 绘制 的 图 表 有 线 图 、 散 点 图 、 条 形 图 、 柱 状 图 、3D 图 形 ， 以 及 图 形 动画 
等 ， 同 时 Matplotlib 还 提供 了 丰富 的 图 形 图 像 工具 。 本 节 将 介绍 Matplotlib 的 安装 和 基本 开 
发 过 程 。 


22.1.1 安装 Matplotlib 


Matplotlib 安装 可 以 使 用 pip 工具 ， 安 装 指令 如 下 : 


pip install matplotlib 


在 Windows 平台 下 执行 pip 安装 指令 过 程 如 图 22-1 所 示 ， 最 后 会 有 安装 成 功 提示 ， 其 他 平台 
的 安装 过 程 也 是 类 似 的 ， 这 里 不 再 装 述 。 

对 于 Windows 平 台 还 需要 安装 Visual C++ 编译 和 运行 环境 ， 很 多 软件 可 以 包含 
Visual C++ 编译 和 运行 环境 ， 如 Microsoft Visual Studio 和 Microsoft Visual C++ 再 发 行 包 
(redistributable packages) 等 ，Microsoft Visual C++ 再 发 行 包 下 载 网 址 如 下 : 

。Microsoft Visual C++ 2010 32 位 再 发 行 包 下 载 网 址 是 https://www.microsoft.com/en-us/ 

download/details.aspx?id=29; 

。Microsoft Visual C++ 2010 64 位 再 发 行 包 下 载 网 址 是 https://www.microsoft.com/en-us/ 

download/details.aspx?id=14632:; 

。Microsoft Visual C++ 2008 32 位 再 发 行 包 下载 网 址 是 https://www.microsoft.com/en-us/ 

download/details.aspx?id=5555; 

。 Microsoft Visual C++ 2008 64 位 再 发 行 包 下载 网 址 是 https://www.microsoft.com/en-us/ 

download/details.aspx?id=15336。 
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图 22-1 pip 安装 过 程 


提示 : 在 Windows 平台 中 可 能 有 些 软件 已 经 安装 了 Visual C++ 编译 和 运行 环境 。 所 以 可 
先 安装 Matplotlib ， 如 果 测 试 无 Matplotlib 程序 ， 再 考虑 安装 Visual C++ 编译 和 运行 环境 


22.1.2 ”图 表 基 本 构成 要 素 


如 图 22-2 所 示 是 一 个 折线 图 表 ， 其 中 图 表 有 标题 ， 图 表 除 了 有 x 轴 和 y 轴 坐标 外 ， 也 可 
以 为 x 轴 和 y 轴 添 加 标题 , x 轴 和 y 轴 有 默认 刻度 ， 也 可 以 根据 需要 改变 刻度 ， 还 可 以 为 刻度 
添加 标题 。 图 表 中 有 类 似 的 图 形 时 可 以 为 其 添加 图 例 ， 用 不 同 的 颜色 标识 出 它们 的 区 别 。 


图 表 标题 
1 
折线 图 
% 一 区 放下 a 
二 外 人 | 图 例 
4 
y 轴 标题 
本 人 
\ 
7 归 
0 
y 轴 刻 厦 ]、、_ 洲 
4 
5 7 3 9 0 1 
} 
COCO 
x 轴 标 题 x 轴 刻 度 
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22.1.3 绘制 折线 图 


下 面 通过 一 个 常用 图 表 介 绍 Matplotlib 库 的 使 用 。 
折线 图 是 由 线 构成 的 ， 是 比较 简单 的 图 表 。 折 线 图 示例 如 下 : 
# coding=utf-8 

# 代码 文件 :chapter22/ch22.1.3.py 


import matplotlib.pyplot as plt 


# 设置 中 文字 体 

plt.rcParams['font.family'] = ['SimHei'] (0) 
:= 5 # x 轴 坐 标 数据 @ 
y= [7, 8, 9, 10] # y 轴 坐 标 数据 @ 
# 绘制 线段 

plt.plot(x，yY，"b'，1label=' 线 1'，1linewidth=2) @ 
plt .title(' 绘制 折线 图 ') # 添加 图 表 标 题 
plt.ylabel('y 轴 ') # 添加 y 轴 标题 
plt.xlabel('x 轴 ') # 添加 x 轴 标 题 
plt.legend() # 设置 图 例 

# 以 分 辩 率 72 来 保存 图 片 

plt.savefig (' 折线 图 '，dpi=72) © 
plt. show!() # 显示 图 形 


上 述 代码 第 Q@ 行 是 设置 中 文字 体 ， 其 中 SimHei 是 黑体 。 如 果 不 设置 中 文字 体 ， 图 表 中 若 
有 中 文 则 无 法 正常 显示 。rcParams 是 Matplotlib 全 局 变量 ， 保 存 一 些 设置 信息 。 

代码 第 @ 行 和 第 @ 行 是 准备 x 和 y 轴 坐 标 数据 ， 坐 标 数据 放 到 列表 或 元 组 等 序列 中 ， 两 个 
序列 数据 一 一 对 应 ， 即 x 的 第 一 个 元 素 对 应 y 的 第 一 个 元 素 。 

代码 第 @ 行 plotO) 函数 是 绘制 一 条 线段 ， 其 中 x 和 y 是 坐标 数据 'b' 参数 是 设置 线段 颜 
色 ， 其 他 颜色 表示 为 红色 Tr'、 绿 色 'g'、 青 色 'c'、 品 红 'm'、 黄 色 'y'、 黑 色 *。plot() 函数 中 的 
label 参数 是 图 例 中 显示 线段 名 ; 参数 linewidth 是 设置 宽度 。 

代码 第 回 行 savefig0 函数 用 来 保存 图 片 ， 第 一 个 参数 为 图 片 文件 名 ，dpi 参数 是 图 片 的 
dpi 值 。 图 片 默认 格式 为 png。 

代码 第 @ 行 show0 函数 用 来 显示 图 片 ， 该 函数 如 果 不 调用 无 法 显示 图 表 。 

程序 运行 启动 一 个 对 话 框 ， 如 图 22-3 所 示 ， 同 时 会 在 当前 目录 下 生成 一 个 名 为 “折线 
图 .png” 的 图 片 。 对 话 框 中 左下 角 是 操作 图 表 的 工具 栏 ， 工 具 栏 中 各 个 按钮 的 功能 读者 可 以 自 
己 尝 试 一 下 ， 这 里 不 再 介绍 。 
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Figure1 - OO 


绘制 折线 图 


全 | 所 |3| 汪 |Q| 斌 


图 22-3 ”程序 运行 结果 


22.1.4 绘制 柱状 图 
绘制 柱状 图 代码 示例 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter22/ch22.1.4.py 


扫 码 看 视频 


import matplotlib.pyplot as plt 


# 设置 中 文字 体 

plt.rcParams['font.family'] = ['SimHei'] 
+ # xl 轴 坐 标 数据 
Y= [Sr 2 .0 21 # yl 轴 坐 标 数据 
x2 = [2, 4, 6, 8, 10] # x2 轴 坐 标 数据 
y= [8 6 2 5 61 # y2 轴 坐 标 数据 
# 绘制 柱状 图 


plt.bar (xl1，yl，label=' 柱状 图 1') OO 
plt.bar (x2，y2，label=' 柱状 图 2') @ 
plt .title(' 绘制 柱状 图 ') # 添加 图 表 标题 
plt.ylabel('y 轴 ') # 添加 y 轴 标 题 
plt.xlabel('x 轴 ') # 添加 x 轴 标 题 
plt.legend() # 设置 图 例 


plt.show() # 显示 图 形 
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上 述 绘制 了 具有 两 种 不 同 图 例 的 柱状 图 。 代 码 第 @ 行 和 第 @ 行 通过 bar0 函数 绘制 柱状 图 。 
运行 程序 会 启动 一 个 对 话 框 ， 如 图 22-4 所 示 。 


绘制 柱状 图 


全 |<| 少 | 和 中 |Q| 三 
图 22-4 程序 运行 结果 
22.1.5 ”绘制 饼 状 图 


饼 状 图 用 来 展示 各 分 项 在 总 和 中 的 比例 。 饼 状 图 有 点 特殊 ， 它 没有 坐标 。 绘 制 饼 状 图 代码 
示例 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter22/ch22.1.5.py 


import matplotlib.pyplot as plt 


# 设置 中 文字 体 


plt.rcParams['font.family'] = ['SimHei'] 
# 各 种 活动 标题 列表 

activies = [" 工 作 "，"' 睡 "，' 吃 "，' 玩 '] 
# 各 种 活动 所 占 时 间 列 表 

slices = [8, 7, 3, 6] 

# 各 种 活动 在 饼 状 图 中 的 颜色 列表 


cols = ['c', m', 'r', 'b'] 


plt.pie(slices, labels=activies, colors=cols, 
shadow=True, explode=(0, 0.1, 0, 0), autopct="'$®.1f%%") 四 


plt .title(' 绘制 饼 状 图 ') 
plt.show() ## 显示 图 形 


上 述 代 码 绘 制 了 一 个 饼 状 图 ， 展 示 了 一 个 人 一 天 中 的 各 项 活动 所 占 比例 。 代 码 第 @ 行 设置 
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活动 标题 ， 代 码 第 @ 行 设置 活动 所 占 时 间 ， 绘 图 时 Matplotlib 会 计算 出 各 个 活动 所 占 比例 。 代 
码 第 @ 行 设置 各 种 活动 在 饼 状 图 中 的 颜色 。 注 意 这 三 个 列表 元 素 的 对 应 关系 。 

绘制 饼 状 图 的 关键 是 代码 第 @ 行 的 pie0 函数 ， 其 中 shadow 参数 是 设置 是 否 有 阴影 ; 
explode 参数 是 设置 各 项 脱离 饼 主 体 效果 。 如 图 22-5 所 示 为 “ 睡 ”活动 脱离 饼 主 体 效果 。 
explode 参数 值 是 (0, 0.1, 0, 0) 元 组 ， 对 应 各 项 ; autopct 参数 设置 各 项 显示 百分比 ，%.1f%% 
是 格式 化 字符 串 ，%.1f 表示 保留 一 位 小 数 ，%% 显示 一 个 百 分 号 “%”。 


Figure1 - oO 


绘制 饼 状 图 


全 | 拟 沪 | 中 QI 三 
图 22-5 程序 运行 结果 
22.1.6 绘制 散 点 图 
散 点 图 用 于 科学 计算 。 绘 制 散 点 图 代码 示例 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter22/ch22.1.6.py 


import matplotlib.pyplot as plt 
import numpy as np 


# 设置 中 文字 体 

plt.rcParams['font.family'] = ['SimHei'] 
plt.rcParams['axes.unicode minus'] = False @O 
n = 1024 


np.random.normal (0, 1, n) 


x 
| | 


@e 


np.random.normal (0, 1, n) 
plt.scatter (x, y) 
plt .title(' 绘制 散 点 图 ') 


plt.show() # 显示 图 形 
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上 述 代 码 绘制 了 一 个 散 点 图 。 代 码 第 @ 行 是 设置 显示 负 号 ， 这 是 由 于 本 例 设置 了 中 文字 
体 ， 这 个 设置 会 影响 图 表 中 负 号 的 显示 ， 因 此 需要 重新 设置 。 代 码 第 @ 行 生成 x 轴 随 机 数 ， 其 
中 np.random.normal() 是 NumpPy 库 提 供 的 计算 随机 函数 ， 本 例 是 生成 1024 个 0~1 的 随机 数 。 
代码 第 @ 行 生成 y 轴 随 机 数 。 代 码 第 @ 行 通过 scatter() 函数 绘制 散 点 图 。 运 行程 序 会 启动 一 个 
对 话 框 ， 如 图 22-6 所 示 。 


Figure 1 - 0O 


3 2 be 0 1 2 3 


任 | 拟 | 注 | 中 |Q| 主 | 加 | 


图 22-6 程序 运行 结果 


22.1.7 绘制 子 图 表 


l 在 一 个 画布 中 可 以 绘制 多 个 子 图 表 ， 设 置 子 图 表 的 位 置 函 数 是 subplot()，subplot() 函数 语 
法 如 下 : 


subplot (nrows, ncols, index, **kwargs) 


参数 nrows 设置 总 行 数 ， 参 数 ncols 设置 总 列 数 ，index 是 要 
绘制 的 子 图 位 置 ，index 从 1 开始 到 nrows X ncols 结束 。 

图 22-7 所 示 是 2 行 2 列子 图 表 布 局 ，subplot(2, 2,1) 函数 A229 (222) 
也 可 以 表示 为 subplot(221)。 


子 图 表示 例如 下 : 


# coding=utf-8 
志 代码 文件 : chapter22/ch22.1.7.py (223) (224) 


import matplotlib.pyplot as plt 
import numpy as np 

图 22-7 子 图 表 布局 
# 设置 中 文字 体 
plt.rcParams['font.family'] = ['SimHei'] 


plt.rcParams['axes.unicode minus'] = False 
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def drowsubbar() : 


""" 绘制 饼 状 图 """ 

Wy = Ts # zl 轴 坐 标 数 据 
yl = [5, 2, 7, 8, 2] # yl 轴 坐 标 数据 
x2 = [2, 4, 6, 8, 10] # x2 轴 坐 标 数据 
y2 = [8, 6, 2, 5, 6] # y2 轴 坐 标 数据 
# 绘制 柱状 图 


plt.bar(xl，yl，label=' 柱状 图 1') 
plt.bar (x2，y2，label=' 柱状 图 2') 


plt.title(' 绘制 柱状 图 ') # 添加 图 表 标题 
plt.ylabel('y 轴 ') # 添加 Y 轴 标 题 
plt.xlabel('x 轴 ') # 添加 x 轴 标题 


plt.title(' 绘制 散 点 图 ') 


def drowsubpie(): 


"绘制 镜 状 图 """ 


< 省 略 绘制 饼 状 图 ， 代 码 参考 22.1.5 节 > 


def drowsubline(): 


"…"" 绘制 折线 图 """ 


< 省略 绘制 饼 状 图 ， 代 码 参考 22.1.3 节 > 


def drowssubscatter () : 


"绘制 散 点 图 """ 


< 省 略 绘制 饼 状 图 ， 代 码 参 考 22.1.6 节 > 


plt.subplot (2, 2, 1) # 替换 (221) 
drowsubbar () 


@e 


plt.subplot (2, 2, 2) # 替换 (222) 


drowsubpie () 


plt.subplot (2, 2, 3) # 替换 (223) 
drowsubline () 
plt.subplot (2, 2, 4) # 替换 (224) 


drowssubscatter () 
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plt.tight layout() # 调整 布局 @ 
Plt.show() # 显示 图 形 


上 述 代 码 第 @ 行 调用 plt.subplot(2, 2, 1) 函数 设置 要 绘制 的 子 图 表 的 位 置 。 代 码 第 @ 行 调 
用 自 定义 函数 drowsubbar() 绘制 柱状 图 。 代 码 第 @ 行 调整 了 各 个 图 表 布 局 ， 使 得 它们 都 能 正常 
显示 。 图 22-8 所 示 是 未 调整 布局 时 的 状态 ， 可 见 子 图 表 之 间 部 分 重 又 ;图 22-9 所 示 是 调整 之 
后 的 布局 效果 。 


绘制 散 点 图 给 制 饼 状 图 


I 仿 


25 给 制 晰 线 团 5 10.0 
一 1 


全 |€| 了 | 中 |Q| 主 | 加 | 


图 22-8 未 调整 布局 


绘制 散 点 图 
8 
6 
堡 4 
2 
0 
2 六 
EE 
给 制 折线 图 
1 -一 可 
9 
是 
8 
71 T 
1 2 3 4 5 
人 #|€|| 十 Q| 寺 | 四 


图 22-9 调整 后 布局 
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22.2 ”项目 实战 : 纳 斯 达 克 股 票数 据 分 析 


第 21 章 爬 取 纳 斯 达 克 股 票数 据 项 目 ， 实 现 了 从 纳 斯 达 克 股 票 网 站 疏 取 数据 ， 经 过 分 析 后 
保存 到 数据 库 中。 本 章 可 以 将 这 些 数据 从 数据 库 中 取出 ， 通 过 本 章 介绍 的 绘制 图 表 技 术 将 数据 
可 视 化 。 


22.2.1 从 数据 库 提 取 股 票数 据 
对 22.4.4 节 中 的 db_access 模块 添加 查询 方法 ， 具 体 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter22/22.2/db/db_access.py 


import pymysql 


def findall hisq data (symbol): @ 
""" 根据 股票 代码 查询 其 股票 历史 数据 """ 


# 1。 建立 数据 库 连 接 

connection = pymysql.connect (host='localhost', 
user='root', 
password="'12345', 
database='nasdaq', 
charset='utf8°') 


# 要 返回 的 数据 
data = [] [2 
try: 

# 2。 创 建 游标 对 象 


with connection.cursor() as cursor: 


# 3。 执行 SQL 操作 

sql = 'select HDate, Open, High, Low, Close, Volume,Symbol ' \ 
"from historicalquote where Symbol = %s' 

cursor.execute(sql, [symbol]) 


# 4。 提取 结果 集 


result_set = cursor.fetchall() 


for row in result set: @ 
fields = {} 
fields['Date'] = row[0] 
fields['Open'] = float (row[1]) 
fields['High'] = float (row[2]) 
fields['Low'] = float (row[3]) 
fields['Close'] = float (row[4]) 
fields['Volume'] = row[5] 
data.append (fields) 
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# with 代码 块 结束 5。 关闭 游标 
except pymysql.DatabaseError as error: 
print (' 数据 查询 失败 ' + error) 
finally: 
# 6。 关闭 数据 库 连接 


connection.close() 


return data 


上 述 代码 第 @ 行 定义 按照 股票 代码 查询 股票 历史 数据 函数 ， 参 数 symbol 是 股票 代码 。 代 
码 第 @ 行 是 定义 返回 数据 变量 data， 它 是 列表 类 型 。 代 码 第 @ 行 是 遍历 结果 集 ， 将 一 条 记录 放 
到 字典 fields 中 ， 再 将 字典 fields 添加 到 列表 data 中 。 


22.2.2 ”绘制 股票 成 交 量 折线 图 


从 成 交 量 可 以 大 体 上 看 出 一 只 股票 的 走势 。 这 一 节 将 对 从 数据 库 里 查询 出 来 的 数据 进行 处 
提取 成 交 量 和 交易 日 期 ， 然 后 绘制 一 张 折线 图 。 代 码 如 下 


# coding=utf-8 
# 代码 文件 : chapter22/22.2/ch22.2.2.py 


import matplotlib.pyplot as plt 


from db.db access import findall hisq data 


def pot hisvolume (dates, volumes): 


""" 苹果 股票 历史 成 交 量 折线 图 """ 


# 设置 中 文字 体 

plt.rcParams['font.family'] = ['SimHei'] 
plt.rcParams['axes.unicode minus'] = False 

# 设置 图 表 大 小 

plt.figure (figsize=(10, 5)) [oO) 
# 绘制 线段 

plt.plot (dates, volumes) 

plt .title(' 苹果 股票 历史 成 交 量 ') # 添加 图 表 标题 
plt.ylabel(' 成 交 量 ') # 添加 y 轴 标题 
plt.xlabel(' 交易 日 期 ') # 添加 x 轴 标题 
plt.show() # 显示 图 形 


def main(): 


""" 主 函 数 """ 
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data = findall hisq data('AAPL') 


# 从 data 中 提取 成 交 量 数据 


volume map = map(lambda it: it['Volume'], data) 
# 将 volume_map 转换 为 成 交 量 列表 
volume list = list (volume map) 


# 从 data 中 提取 日 期 数据 

date map = map (lambda it: it['Date'], data) 
# 将 date_map 转换 为 日 期 列表 

date list = list (date_map) 


pot_hisvolume (date_list, volume list) 四 


if _name == '_ main_': 


main() 


上 述 代 码 第 @ 行 figure0 函数 是 设置 图 表 大 小 ， 由 于 本 项 目 数 据 事实 上 是 过 去 三 个 月 的 历 
史 数 据 ， 默 认 图 表 太 小 ， 需 要 设置 得 宽 一 些 。 figsize 参数 是 一 个 元 组 ， 分 别 表示 图 表 的 高 和 宽 ， 
单位 是 英寸 。 

从 数据 库 查 询 处 理 的 数据 包含 了 开盘 价 、 收 盘 价 、 最 高 价 、 最 低 价 、 交 易 量 和 交易 日 
期 ， 本 例 中 只 需要 交易 量 和 交易 日 期 ， 交 易 日 期 作为 x 轴 ， 交 易 量 作为 y 轴 。 代 码 第 @ 行 是 从 
data 变量 中 提取 出 成 交 量 数 据 ，data 保存 了 从 数据 库 查 询 出 的 数据 ， 这 里 使 用 了 map() 函数 ， 
Lambda 表达 式 it: it["Volume'] 指定 提取 成 交 量 字 段 。 代 码 第 @ 行 返回 的 是 成 交 量 map 结构 数 
据 ， 需 要 通过 代码 第 @ 行 list( 函数 将 map 结构 转换 为 列表 结构 。 从 data 中 提取 日 期 数据 与 成 
交 量 提取 类 似 ， 这 里 不 再 歼 述 。 运 行程 序 后 启动 一 个 对 话 框 ， 如 图 22-10 所 示 。 


1e7 苹果 股票 历史 成 交 量 


2017-12-27 2018-01-10 2018-01-24 2018-02-07 2018-02-21 2018-03-07 
交易 日 其 


全 《| 了 | 中 Ql 二 


图 22-10 程序 运行 结果 


22.2.3 绘制 股票 OHLC 柱状 图 
想 更 进一步 分 析 股 票 信息 ， 则 需要 查看 和 分 析 开盘 价 、 最 高 价 、 最 低 价 、 收 盘 价 等 数据 ， 轩 9 
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开盘 价 、 最 高 价 、 最 低 价 、 收 盘 价 也 称 为 OHLC (Open-High-Low-Close)， 如 果 把 OHLC 数据 
全 部 绘制 到 一 张 图 上 可 以 便于 进行 数据 分 析 ， 但 是 这 样 一 个 简单 的 柱状 图 看 起 来 是 有 困难 的 ， 
这 需要 区 线 图 ，22.2.4 节 将 介绍 KK 线 图 的 绘制 ， 本 节 绘 制 了 4 个 柱状 子 图 ， 如 图 22-11 所 示 。 


草 困 股票 历史 成 交 量 
证 mw 
和 2017-12-26 2018-01-09 2018-01-23 2018-02-06 2018-02-20 2018-03-06 2018-03-20 
交易 日 其 
草 果 股票 历史 成 交 量 
和 
2017-12-26 2018-01-09 2018-01-23 2018-02-06 2018-02-20 2018-03-06 2018-03-20 
交易 日 期 
草 困 股票 历史 成 交 量 
起 100 
a 2017-12-26 2018-01-09 2018-01-23 2 2018-02-06 2018-02-20 2018-03-06 2018-03-20 
草 困 股票 历史 成 交 量 
昌 100 
2017-12-26 2018-01-09 2018-01-23 2018-02-06 2018-02-20 2018-03-06 2018-03-20 
交易 日 其 
有 €|| 中 QQ 所 | 
图 22-11 OHLC 柱状 子 图 
代码 如 下 : 
# coding=utf-8 
# 代码 文件 : chapter22/22.2/ch22.2.3.py 


import matplotlib.pyplot as plt 


from db.db_ access import findall hisq data 


# 设置 中 文字 体 
plt.rcParams['font.family'] = ['"SimHei'] 
plt.rcParams['axes.unicode minus'] = False 


def pot his bar(date_ list, p_list, ylabel): [0 
""" 绘制 oOHLC 柱状 图 """ 


# 绘制 柱状 图 

plt.bar(date list, p_list) 

plt .title (' 苹果 股票 历史 成 交 量 ' ) # 添加 图 表 标 题 
plt.ylabel(ylabel) # 添加 y 轴 标 题 
plt.xlabel(' 交易 日 期 ') # 添加 x 轴 标题 


def main(): 
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on 主 函数 wm 
data = findall hisq data('AAPL') 


# 从 data 中 提取 日 期 数据 

date map = map (lambda it: it['Date'], data) 加 
# 将 date_map 转换 为 日 期 列表 

date list = list (date map) 


# 从 data 中 提取 开盘 价 数据 
open map = map (lambda it: it['Open'], data) 
# 将 open_map 转换 为 开盘 价 列表 


open list = list(open map) 


# 从 data 中 提取 最 高 价 数据 
high map = map(lambda it: it['High'], data) 
# 将 high_map 转换 为 最 高 价 列表 
high list = list(high map) 


# 从 data 中 提取 最 低 价 数据 
low map = map(lambda it: it['Low'], data) 
# 将 open_map 转换 为 最 低 价 列表 


low list = list(low map) 


# 从 data 中 提取 收盘 价 数据 
close map = map (lambda it: it['Close'], data) 
# 将 open_map 转换 为 收盘 价 列表 


close list = list(close map) 四 


# 设置 图 表 大 小 
plt.figure (figsize=(10, 6)) 


plt.subplot (411) 四 
pot_his_bar (date_1list，open_list,，' 开盘 价 ') 


plt.subplot (412) 
pot_his bar(date_list，close_1list,， 收盘 价 ') 


plt.subplot (413) 
pot_his_bar(date_list，high_1ist，' 最 高 价 ') 


plt.subplot (414) 


pot_his_bar(date_list，1low_list，' 最 低 价 ') © 
plt.tight layout() # 调整 布局 
plt.show() # 显示 图 形 

if _name =="' main_': 


main () 
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上 述 代码 第 四 行 定 义 了 绘制 柱状 分 析 图 函数 pot his_ bar(date list p_list, ylabel)， 其 中 参数 
date list 是 日 期 列表 ， 参 数 p_list 是 OHLC 数据 列表 ， 参 数 ylabel 是 要 绘制 图 表 的 y 轴 标 题 。 

代码 第 @ 行 和 第 图 行 是 从 data 中 提取 OHLC 数据 列表 。 代 码 第 @ 行 和 第 回 行 是 调用 pot_ 
his_bar() 函数 绘制 4 个子 图 表 。 


22.2.4 绘制 股票 K 线 图 


K 线 图 (Candlestick charb 又 称 “ 阴 阳 烛 ”图 ， 它 将 OHLC 信息 绘制 在 一 张 图 表 上 ， 宏 观 

上 可 以 反映 出 价格 走势 ， 微 观 上 可 以 看 出 每 天 涨 跌 等 信息 。K 线 图 广泛 用 于 股票 、 期 货 、 贵 金 
属 、 数 字 货 币 等 行情 的 技术 分 析 ， 称 为 K 线 分 析 。 
K 线 可 分 “阳线 ”阴线 ”和 “中 立 线 ”三 种 ， 阳线 阴线 
阳线 代表 收盘 价 大 于 开盘 价 ， 阴 线 代 表 开 盘 价 大 最 高 价 最 高 价 
于 收盘 价 ， 中 立 线 则 代表 开盘 价 等 于 收盘 价 。 如 
图 22-12 所 示 ，K 线 中 的 阴阳 线 ， 在 中 国 、 日 本 。 -2 
和 韩国 ， 阳 线 以 红色 表示 ， 阴 线 以 绿色 表示 ， 即 
红 升 绿 跌 ， 而 在 欧美 ， 习 惯 则 正好 相反 ， 阴 线 以 
红色 表示 ， 阳 线 以 绿色 表示 ， 绿 升 红 跌 。 

Matplotlib 早期 版 本 中 包含 了 一 个 finance 
模 块 ， 从 Matplotlib 2.2.0 开 始 finance 模 块 开盘 价 人 
从 Matplotlib 中 脱离 出 来 ， 作 为 一 个 独立 于 
Matplotlib 的 图 表 库 一 一 mpl finance 存在 ， 下 载 
地 址 为 https://github.com/matplotlib/mpl] finance， 图 22-12 下 线 中 的 阴阳 线 
所 以 需要 额外 安装 mpl_finance。 

安装 mpl_finance 可 以 使 用 pip 工具 ， 安 装 指令 如 下 : 


回 
扫 码 看 视频 


开 玲 价 


最 低 价 ja 最 低 价 


pip install https://github.com/matplotlib/mpl finance/archive/master.zip 


在 Windows 平台 下 执行 pip 安装 指令 的 过 程 如 图 22-13 所 示 ， 最 后 会 有 安装 成 功 提示 ， 其 他 平 
台 安 装 过 程 也 是 类 似 的 ， 这 里 不 再 獒 述 。 


一 造 至 CNWINDOWSMystemazwmdexe 


图 22-13 pip 工具 安装 mpl_finance 


另外 ， 在 金融 数据 分 析 
了 金融 数据 分 析 ，Pandas 为 
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pip 工具 ， 安 装 指 令 如 下 : 


pip install pandas 


在 Windows 平台 下 执行 pip 安装 指令 的 过 程 如 图 22-14 所 示 ， 最 后 


台 安 装 过程 也 是 类 似 的， 这 里 不 再 次 述 。 


一 CNWindowssystemazemdeme 


图 22-14 ”pip 工具 安装 Pandas 


安装 成 功 后 就 可 以 编写 代码 了 ， 示 例 代 码 如 下 : 


# coding=utf-8 


# 代码 文件 ，chapter22 


import 


import 
import 
import 


import 


2.2/ch22.2.4.py 


csv 


as mdates 


matplotlib.dates 
matplotlib.pyplot as plt 
mpl_finance 


pandas 


from db.db_access import findall hisq data 


# 设置 中 文字 体 
plt.rcParams['font.family'] = ['SimHei'] 
plt.rcParams['axes.unicode minus'] = False 


def pot candlestick ohlc (datafile): 


绘制 kK 线 图 


# 从 CSV 文件 中 读 取 数 据 到 DataFrame 数据 结构 中 


quotes = pandas.read csv (datafile, 


index col=0, 


parse_dates=True, 


往往 会 用 到 另外 一 个 数据 分 析 包 Pandas。 最 初 设计 Pandas 是 为 
计 间 序列 分 析 金 融 数 据 提供 了 很 好 的 支持 。 安 装 Pandas 可 以 使 用 


| 


会 有 安装 成 功 提示 ， 其 他 于 
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infer datetime format=True) ©@ 


# 绘制 一 个 子 图 ， 并 设置 子 图 大 小 


fig, ax = plt.subplots (figsize=(10, 5)) @ 
# 调整 子 图 参数 SubplotParams 
fig.subplots_adjust (bottom=0.2) @ 


mpl finance.candlestick ohlc(ax, zip(mdates.date2num(quotes.index.to pydatetime ()), 
quotes['Open'], quotes['High'], 
quotes['Low'], quotes['Close']), 
width=1, colorup='r', colordown='g') @ 


ax.xaxis_date() 
ax.autoscale_view() @ 
plt.setp(plt.gca().get xticklabels(), rotation=45, horizontalalignment= 
'right') 
plt.show() 
def main(): 
www 主 函 数 """ 


data = findall hisqg data('AAPL') 


# 列 名 
colsname = ['Date', 'Open', '‘'High', 'Low', 'Close', 'Volume'] 
# 临时 数据 文件 名 


datafile = temp.csv’' 

# 写 入 数据 到 临时 数据 文件 

with open (datafile, 'w', newline='', encoding='utf-8') as wf: [®) 
writer = csv.writer (wf) 
writer.writerow (colsname) 
for quotes in data: 


row = [quotes['Date'], quotes['Open'], quotes['High'], 
quotes['Low'], quotes['Close'], quotes['Volume']] 
writer.writerow (row) mm) 
# 调用 绘图 函数 


pot_candlestick ohlc (datafile) ! 


if _name == '_ main_': 


main () 


上 述 代码 第 四 行 定义 了 绘制 玉 线 图 函数 pot_candlestick_ohlc(datafile)， 该 函数 是 绘制 及 
线 图 的 核心 。 

代码 第 @@ 行 是 调用 Pandas 的 read_csv0 函数 ， 实 现 了 从 CSV 文 件 中 读 取 数据 到 
DataFrame 数据 结构 中 ， 返 回 数据 保存 在 quotes 变量 中 。quotes 变量 是 DataFrame 类 型 ， 
DataFrame 是 Pandas 提供 的 二 维 的 数据 结构 。 另 外 ，read_csv0 函数 的 参数 datafile 是 CSV 
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文件 ，index_col=0 指定 索引 列 为 第 1 列 ，parse_dates=True 指定 解析 时 间 ，infer datetime 
format=True 是 设置 自动 推断 日 期 格式 。 


提示 : 代码 第 四 行 的 quotes 变量 是 绘制 民 线 图 所 需 数 据 ， 它 是 DataFrame 结构 。 理 论 上 
也 可 以 通过 自己 调用 DataFrame 构造 方法 创建 quotes 对 象 ， 但 DataFrame 结构 过 于 复杂 ， 笔 
者 推荐 使 用 Pandas 的 read_csv() 函数 从 CSV 文件 数据 返回 quotes 对 象 。 


代码 第 @ 行 是 准备 绘制 子 图 ， 虽 然 画 布 上 只 有 一 个 图 ， 这 里 也 需要 使 用 子 图 ， 这 是 因为 
subplots() 函数 能 返回 图 表 对 象 和 坐标 轴 对 象 。 代 码 第 @ 行 是 调整 子 图 参数 SubplotParams， 
bottom=0.2 是 设置 图 表 到 底 边 的 距离 。 

代码 第 回 行 调用 mpl_finance 的 candlestick_ohl() 函数 绘制 KK 线 图 ， 第 一 个 参数 ax 是 坐 
标 轴 ; 第 二 个 参数 使 用 zip0 函数 获得 元 组 对 象 ， 表 达 式 mdates.date2num(quotes.index.to_ 
pydatetime()) 是 使 用 matplotlib.dates 提供 的 函数 date2num 将 日 期 转换 为 数值 ，quotes.index. 
to_pydatetime() 是 将 索引 列 (交易 日 期 ) 转换 为 datetime 日 期 时 间 类 型 ，width=1 参数 是 设置 
KK 线 中 “阴阳 烛 ” 的 宽度 ; colorup="r' 设置 阳线 为 红色 ; colordown='g' 设置 阴线 为 绿色 。 这 个 
设置 符合 中 国人 的 习惯 。 

代码 第 @ 行 是 设置 x 轴 数据 以 日 期 形式 显示 ; 代码 第 @ 行 是 设置 自动 缩放 图 表 ， 以 便 
于 能 够 在 对 话 框 中 完全 显示 ; 代码 第 @ 行 plt.setp(plt.gca().get_xticklabels(), rotation=45， 
horizontalalignment='right) 也 是 设置 图 表 x 轴 显示 刻度 标题 ， 其 中 plt.gca().get_xticklabels() 
获得 x 轴 刻 度 标题 ， 见 图 22-15 所 示 的 x 轴 显 示 的 日 期 ，rotation=45 让 刻度 标题 倾斜 45 度 ， 
如 图 22-15 所 示 ; horizontalalignment='right' 是 设置 刻度 标题 右 对 齐 显示 。 

代码 第 @ 行 和 第 @ 行 是 将 数据 库 查询 出 来 的 数据 写 入 本 地 CSV 文件 。 需 要 注意 CSV 文件 
第 一 行 是 列 标题 ， 从 第 二 行 开始 是 数据 行 。 

代码 第 ! 行 是 调用 绘图 函数 pot_candlestick_ohlc(datafile) 绘制 K 线 图 。 

运行 程序 会 启动 一 个 对 话 框 ， 如 图 22-15 所 示 。 


全 |€| 了 | 后 |Q| 夺 | 加 | 


图 22-15 图表 运行 结果 


国 
和 
回 


扫 码 看 视频 


项 目 实战 3: PetStore 宠物 


> 商店 项 目 


前 面 已 经 介绍 了 两 个 实战 项 目 ， 实 现 了 网 络 息 虫 和 数据 可 视 化 。 从 本 章 开始 会 介绍 三 个 相 
对 大 一 点 的 项 目 ， 这 三 个 项 目 采用 敏捷 方法 进行 开发 ， 敏 捷 方 法 是 软件 项 目 开发 的 最 佳 实践 方 
法 ， 具 体 包 括 如 下 几 项 : 

。， 增 量 迭 代 

。 小 型 发 布 

。 测试 驱动 

。 科 学 分 配 任务 
其 中 测试 驱动 超出 了 本 书 范围 ， 这 里 不 再 介绍 。 

本 章 介绍 通过 Python 语言 实现 的 PetStore 宠物 商店 项 目 ， 所 涉及 的 知识 点 有 Python 面 
向 对 象 、wxPython 图 形 用 户 界 面 编程 和 Python 数据 库 编 程 相关 等 知识 ， 其 中 还 会 用 到 很 多 
Python 基础 知识 。 


23.1 系统 分 析 与 设计 


本 节 将 对 PetStore 宠物 商店 项 目 进行 分 析 和 设计 ， 其 中 设计 过 程 包括 原型 设计 、 数 据 库 设 
计 、 架 构 设计 和 系统 设计 。 


23.1.1 项 目 概述 


PetStore 是 Sun ( 现 Oracle) 公司 为 了 演示 自己 的 Java EE 技术 而 编写 的 一 个 基于 Web 完 
物 店 项 目 ， 如 图 23-1 所 示 为 项 目 启 动 页 面 。 有 关 项 目 介绍 的 网 址 是 http://www.oracle.com/ 
technetwork/java/index-136650.html 。 

PetStore 是 典型 的 电子 商务 项 目 ， 是 现在 很 多 电 商 平台 的 和 雏形。 技术 方面 主要 是 Java EE 
技术 ， 用 户 界 面 采 用 Java Web 技术 实现 。 但 本 书 介绍 的 是 Python 语言 ， 而 且 也 没有 介绍 Web 
技术 ， 所 以 本 章 的 PetStore 项 目 采 用 Python 语言 实现 ， 用 户 界面 采用 Python 的 wxPython 技 
术 实现 。 
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Java Pet Store Seller | Search | Catalog | Map | Main 


News from BluePrints 


图 23-1 PetStore 项 目 启动 页 面 


23.1.2 ”需求 分 析 


PetStore 宠物 商店 项 目 主要 功能 如 下 
“用户 登录 

“查询 商品 

， 添加 商品 到 购物 车 

“ 查看 购物 车 

“ 下 订单 

.查看 订单 

采用 用 例 分 析 函 数 描述 如 图 23-2 所 示 。 


查询 商品 


添加 商品 到 购物 车 


图 23-2 ”PetStore 宠物 商店 用 例 图 


23.1.3 ”原型 设计 


原型 设计 草图 对 于 开发 人 员 、 设 计 人 员 、 测 试 人 员 、UI 设计 人 员 以 及 用 户 都 是 非常 重要 名 
的 。PetStore 宠物 商店 项 目 原 型 设计 图 如 图 23-3 所 示 。 扫 码 看 视频 
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选中 并 辣 加 购物 车 


| 商 噩 砷 请 痛 1 om 
T 商品 音 有 ee 
二， 末 二 烦 大 让 王 名 机 水 到 
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图 23-3 ”PetStore 宠物 商店 项 目 原型 设计 图 
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23.1.4 数据 库 设 计 


Sun 提供 的 PetStore 宠物 商店 项 目 数据 库 设 计 比 较 复 杂 ， 根 据 如 图 23-2 的 用 例 图 重新 设 国 刀 
计数 据 库 ， 数 据 库 设 计 模 型 如 图 23-4 所 示 。 


扫 码 看 和 
accounts Onders 

userid varchar(80) <pl> orderid bigint Dy 
password varchar (25) userid varchar(80) 
email varchar(80) orderdate datetime 
name varchar (80) tatiie int 
addr varchar (80) edt decimal (10, 2) 
city varchar (80) he 
country varchar (20) A 
phone varchar(80) | 

| 

products 

productid varchar(10) <pk> 
category 。 varchar(10) | 
cname varchar (80) = "rerdtalls 一 
ename varchar (80) orderid bigint 《pk 
image varchar(20) productid varchar(10， <pk, fk2> 
descn varchar(255) quantity 。 int 
listprice decimal (10, 2) unitcost decimal (10, 2) 
unitcost decimal (10,2) 


图 23-4 数据 库 设 计 模型 


对 数据 库 设计 模型 中 各 个 表 进 行 如 下 说 明 。 

1. 用 户 表 

用 户 表 (accounts) 是 PetStore 宠物 商店 的 注册 用 户 名 ， 用 户 Id (userid) 是 主键 ， 用 户 表 
结构 如 表 23-1 所 示 。 


表 23-1 用 户 表 
字 段 名 外 键 | 备 注 
rT TT DE EE EE EE 
password varchar(25) | vahao | 25 | 一 | 五 | 否 用 户 密 码 
email varchar(80) 否 否 用 户 Email 
addr varchar(80) 否 否 地 址 
country varchar(20) 20 否 否 国家 


2.， 商品 表 

商品 表 (products) 是 PetStore 宠物 商店 所 销售 的 商品 (宠物 )， 商 品 Id@roductid) 是 主键 ， 
商品 表 结 构 如 表 23-2 所 示 。 

3. 订单 表 

订单 表 (orders) 记录 了 用 户 每 次 购买 商品 所 生成 的 订单 信息 ， 订 单 Id (orderid) 是 主键 ， 
订单 表 结 构 如 表 23-3 所 示 。 
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表 23-2 商品 表 


字 段 名 数据 类 型 


varchar(10) 


部 
学 
Ht 
条 


备 注 


| 
并 


productid 
商品 类 别 
商品 中 文 名 


category varchar(10) 


cname varchar(80) 


ename varchar(80) 


商品 图 片 


image varchar(20) 


varchar(255) 
商品 市 场 价 
商品 单价 


listprice decimal(10,2) 


有 


unitcost decimal(10,2) 


orderid 


status 订单 付款 状态 ，0 待 
付款 ，1 已 付款 


= i 


4. 订单 明细 表 

订单 表 中 不 能 描述 其 中 有 哪些 商品 ， 购 买 商品 的 数量 ， 购 买 时 商品 的 单价 等 信息 ， 这 些 信 
息 被 记录 在 订单 明细 表 中 。 订 单 明细 表 (ordersdetails) 记录 了 某 个 订单 更 加 详细 的 信息 ， 订 单 
明细 表 主 键 是 由 orderid 和 productid 两 个 字段 联合 而 成 的 ， 是 一 种 联合 主键 ,订单 明 细 表 结构 
如 表 23-4 所 示 。 


表 23-4 订单 明细 表 


字 段 名 


orderid 


productid 


quantity 


unitcost 


从 图 23-4 所 示 的 数据 库 设计 模型 可 以 编写 DDL (数据 定义 ) 语句 ”， 使 用 这 些 语 句 可 以 很 
方便 地 创建 和 维护 数据 库 中 的 表 结构 。 


@ 数据 定义 语句 ， 用 于 创建 、 删 除 和 修改 数据 库 对 象 ， 包 括 DROP、CREATE、ALTER、GRANT、REVOKE 
和 TRUNCATE 等 语句 。 
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23.1.5 ”架构 设计 


无 论 是 复杂 的 企业 级 系统 ， 还 是 手机 上 的 应 用 ， 都 应 该 有 效 地 组 织 程序 代码 ， 进 而 提高 开 回 
发 效率 、 降 低 开 发 成 本 ， 这 就 需要 设计 。 而 架构 设计 就 是 系统 的 “骨架 ”， 它 源 自 于 前 人 经 验 
的 总 结 和 提炼 。 但 遗憾 的 是 本 书 的 定位 是 初学 者 ， 并 不 是 介绍 架构 设计 方面 的 书 。 为 了 满足 开 
发 PetStore 宠物 商店 项 目 需要 ， 这 里 笔者 给 出 最 简单 的 架构 设计 结果 。 

世界 著名 软件 设计 大 师 Martin Fowler 在 他 的 《企业 应 用 架构 模式 》 (Patterns of Enterprise 
Application Architecture) 一 书 中 提 到 ， 为 了 有 效 地 组 织 代码 ， 一 个 系统 应 该 分 为 三 个 基本 层 
如 图 23-5 所 示 。“ 层 ”(Layer) 是 相似 功能 的 类 和 接口 的 集合 ,“ 层 ”之 间 是 松 耦合 的 ,“ 层 ” 
的 内 部 是 高 内 聚 的 。 

1) 表示 层 

表示 层 是 用 户 与 系统 交互 的 组 件 集合 。 用 户 通过 这 一 层 向 系统 提交 请 求 或 发 出 指令 ， 系 统 
通过 这 一 层 接收 用 户 请 求 或 指令 ， 待 指令 消化 吸收 后 再 调用 下 一 层 ， 接 着 将 调用 结果 展现 到 这 
一 层 。 表 示 层 应 该 是 轻薄 的 ， 不 应 该 具有 业务 逻辑 。 

2) 服务 层 

服务 层 是 软件 系统 的 核心 业务 处 理 层 。 服 务 层 负责 接收 表示 层 的 指令 和 数据 ， 待 指令 和 数 
据 消 化 吸收 后 ， 再 进行 组 织 业 务 逻辑 的 处 理 ， 并 将 结果 返回 给 表示 层 。 

3) 数据 持久 层 

数据 持久 层 用 于 访问 持久 化 数据 ， 持 久 化 数据 可 以 是 保存 在 数据 库 、 文 件 、 其 他 系统 或 者 
网 络 的 数据 。 根 据 不 同 的 数据 来 源 ， 数 据 持 久 层 会 采用 不 同 的 技术 。 如 果 数 据 保存 到 数据 库 
中 ， 则 使 用 Python DB-API 和 PyMySQL 等 技术 ; 如 果 数 据 保存 为 JSON 格式 等 文件 形式 ， 则 
需要 用 IO 流 和 JSON 解码 技术 实现 。 

Martin Fowler 分 层 架构 设计 看 起 来 像 一 个 多 层 “ 有 蛋糕”"”， 有 蛋糕 师 们 在 制作 多 层 “ 蛋 糕 ” 的 
时 候 先 做 下 层 再 做 上 层 ， 最 后 做 顶层 。 没 有 下 层 就 没有 上 层 ， 这 叫 作 “上 层 依赖 于 下 层 ”。 为 
了 降低 松 耦 度 ， 层 之 间 还 需要 定义 接口 ， 通 过 接口 隔离 实现 细节 ， 上 层 调 用 者 只 用 关心 接口 ， 
不 用 关心 下 一 层 的 实现 细节 。 

Martin Fowler 分 层 架 构 是 基本 形式 ， 在 具体 实现 项 目 设 计时 ， 可 能 会 有 所 变化 。 本 章 实 
现 的 PetStore 宠物 商店 项 目 ， 由 于 简化 了 需求 ， 逻 辑 比 较 简 单 ， 可 以 不 需要 服务 层 ， 表 示 层 可 
以 直接 访问 数据 持久 层 。 如 图 23-6 所 示 ， 表 示 层 采用 wxPython 技术 实现 ， 数 据 持 久 层 采 用 
Python DB-API 和 PyMySQL 技术 实现 。 


表示 层 


服务 层 
数据 持久 层 


图 23-5 Martin Fowler 分 层 架构 设计 图 23-6 ”PetStore 宠物 商店 项 目 架构 设计 


数据 持久 层 
(Python DB-API) 


23.1.6 ”系统 设计 


系统 设计 是 在 具体 架构 下 的 设计 实现 ，PetStore 宠物 商店 项 目 主要 分 为 表示 层 和 数据 持久 
层 。 下 面 分 别 介绍 它们 的 具体 实现 。 
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1. 数据 持久 层 设 计 

数据 持久 层 在 具体 实现 时 ， 会 采用 DAO (数据 访问 对 象 ) 设计 模式 ， 数 据 库 中 每 一 个 数据 
表 对 应 一 个 DAO 对 象 ， 每 一 个 DAO 对象 中 都 有 访问 数据 表 的 CRUD 四 类 操作 。 

如 图 23-7 所 示 为 PetStore 宠物 商店 项 目的 数据 持久 层 类 图 ， 其 中 定义 了 4 个 DAO 类 ， 这 
4 个 类 对 应 数据 库 中 的 4 个 数据 表 ，DAO 中 一 般 包含 对 数据 库 表 的 CRUD 操作 。 


OrderDao 


findall(self) 


createl(self order) 


OrderDetailDao 
findbycat(self, catname) 一 一 一 一 一 一 一 一 
findbyid(self, productid) create(self, 


图 23-7 PetStore 宠物 商店 项 目 数据 持久 层 类 图 


2， 表 示 层 设计 

表示 层 主要 使 用 wxPython 技术 ， 每 一 个 界面 就 是 一 个 窗口 〈wx.Frame) 对 象 。 在 表示 
层 中 各 个 窗口 是 依据 原型 设计 而 来 的 。PetStore 宠物 商店 项 目 表 示 层 类 如 图 23-8 所 示 ， 其 中 
有 LoginFrame 用 户 登 录 窗 口 、CartFrame 购物 车 窗口 和 ProductListFrame 商品 列表 窗口 三 个 
窗口 类 ， 它 们 有 共同 的 父 类 MyFrame。MyFrame 类 是 根据 自己 的 项 目 情 况 封装 的 wx.Frame 
类 ， 从 类 图 中 可 见 CartFrame 与 ProductListFrame 具有 关联 关系 ，CartFrame 包 含 一 个 对 
ProductListFrame 的 引用 。 


wx.Frame 


MyFrame 
| 


LoginFrame CartFrame ProductListFrame 


CartGridTable ProductListGridTable 


ee 
23-8 PetStore 宠物 商店 项 目 表示 层 类 图 
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另外 ，CartFrame 与 ProductListFrame 会 使 用 到 网 格 ， 所 以 需要 两 个 自 定 义 GridTableBase 
类 ， 即 CartGridTable 和 ProductListGridTable。 


23.2 任务 1: 创建 数据 库 
在 设计 完成 之 后 ， 编 写 Python 代码 之 前 应 该 创建 数据 库 。 


23.2.1 壕 代 1.1: 安装 和 配置 MySQL 数据 库 

首先 应 该 为 开发 该 项 目 准备 好 数据 库 。 本 书 推荐 使 用 MySQL 数据 库 ， 如 果 没 有 安装 
MySQL 数据 库 ， 可 以 参考 17.2 节 安 装 MySQL 数据 库 。 

23.2.2” 壕 代 1.2: 编写 数据 库 DDL 脚本 


按照 图 23-4 所 示 的 数据 库 设计 模型 ， 编 写 数据 库 DDL 脚本 。 当 然 ， 也 可 以 通过 一 些 工具 国 鼎 以 回 
生成 DDL 脚本 ， 然 后 把 这 个 脚本 放 在 数据 库 中 执行 就 可 以 了 。 下 面 是 编写 的 DDL 脚本 。 


/* 创建 数据 库 */ 
CREATE DATABASE IF NOT EXISTS petstore; 


use petstore; 


2* 用户 庄 去/ 

CREATE TABLE IF NOT EXISTS accounts ( 
userid varchar(80) not null, /* 用户 Id */ 
password varchar(25) not null, /* 用 户 密码 */ 
email varchar (80) not null, /* 用 户 Email */ 
name varchar(80) not null, 7* 用 户 名 */ 
addr varchar (80) not null, /* 地 址 */ 
city varchar (80) not null, /* ”所 在 城市 */ 
country varchar (20) not null, /* ”国家 */ 
phone varchar(80) not null, /* ”电话 号 码 */ 


PRIMARY KEY (userid)); 


/* 商品 表 */ 

CREATE TABLE IF NOT EXISTS products ( 
productid varchar (10) not null, /* 商品 Id */ 
category varchar(10) not null, /* 商品 类 别 */ 
cname varchar(80) null, /* 商品 中 文 名 */ 
ename varchar (80) null, /* 商品 英文 名 */ 
image varchar(20) null, /* 商品 图 片 */ 
descn varchar (255) null, /* 商品 描述 */ 
listprice decimal (10,2) null, /* 商品 市 场 价 */ 
unitcost decimal(10,2) null, /* 商品 单价 */ 


PRIMARY KEY (productid)); 


/* 订单 表 */ 
CREATE TABLE IF NOT EXISTS orders ( 
orderid bigint not null, /* 订单 Id */ 
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userid varchar (80) not null, /* 下 订单 的 用 户 Id */ 

orderdate datetime not null, /* 下 订单 时 间 */ 

status int not null default 0, /* 订单 付款 状态 “0 待 付款 1 已 付款 */ 
amount decimal(10,2) not null, /* 订单 应 付 金 额 */ 


PRIMARY KEY (orderid)); 


/* 订单 明细 表 */ 
CREATE TABLE IF NOT EXISTS orderdetails ( 


orderid bigint not null, /+ 订单 Id */ 
productid varchar(10) not null, /* 商品 Id */ 
quantity int not null, /* 商品 数量 */ 
unitcost decimal(10,2) null, /* 商品 单价 */ 


PRIMARY KEY (orderid, productid)); 


如 果 读 者 对 于 编写 DDL 脚本 不 熟悉 ， 可 以 直接 使 用 笔者 编写 好 的 jpetstore-mysql-schema. 
sql 脚本 文件 ， 该 文件 位 于 PetStore 项 目下 的 db 目录 中 。 


23.2.3 ”迭代 1.3: 插 人 初始 数据 到 数据 库 


PetStore 宠物 商店 项 目 有 一 些 初始 的 数据 ， 这 些 初始 数据 在 创建 数据 库 之 后 插入 。 这 些 插 
入 数据 的 语句 如 下 : 


use petstore; 


/* 用 户 表 数 据 */ 

INSERT INTO accounts VALUES('j2ee','j2ee','yourname@yourdomain.com',' 关 东升 '， 
"北京 丰台 区 '，' 北京 '，' 中 国 '， '18811588888'); 

INSERT INTO accounts VALUES('ACID','ACID','acid@yourdomain.com', 'Tony', '901 San 
Antonio Road'， 'Palo Alto', 'USA', "555-555-5555")? 


/* 商品 表 数 据 */ 

INSERT INTO products VALUES ('FI-SW-01',' 鱼 类 ',' 神仙 鱼 '，'Angelfish'，'fishl.jpg', 
' 来 自 澳 大 利 亚 的 咸 水 鱼 '， 650，400) 

INSERT INTO products VALUES ('FI-SW-02',' 鱼 类 ',' 虎 区 '，'Tiger Shark', 'fish4.gif', 
' 来 自 澳大利亚 的 威 水 鱼 '，850，600); 


INSERT INTO products VALUES ('RAV-CB-01'，' 鸟 类 '，' 亚马逊 鹦鹉 '， 'amazon Parrot', 
"bird4.gif'，' 寿命 长 达 75 年 的 大 岛 '，3150，3000) 

INSERT INTO products VALUES ('AV-SB-02',' 鸟 类 ',' 省 科 鸣 鸟 '"，'Finch','birdl.gif', 
' 会 唱歌 的 鸟 儿 '，150，110); 


如 果 读 者 不 愿意 自己 编写 插入 数据 的 脚本 文件 ， 可 以 直接 使 用 笔者 编写 好 的 jpetstore- 
mysql-dataload.sql 脚本 文件 ， 该 文件 位 于 PetStore 项 目下 的 db 目录 中 。 


23.3 任务 2: 初始 化 项 目 


本 项 目 推荐 使 用 PyCharm IDE 工具 ， 所 以 首先 参考 3.2 节 创建 一 个 PyCharm 项 目 ， 项 目 
名 称 定 为 PetStore。 


第 23 章 项 目 实战 3 PetStore 宠物 商店 项 目 | 区 361 


23.3.1 ” 壕 代 2.1: 添加 资源 图 片 


项 目 中 会 用 到 很 多 资源 图 片 ， 为 了 使 用 方便 ， 这 些 图 片 
最 好 放 到 一 个 项 目 目录 下 。 参 考 图 23-9 在 项 目 根 目录 下 创 re 
建 resource 文件 夹 ， 然 后 在 resource 文件 夹 下 再 创建 icon 和 sp 
images 文件 夹 。 项 目的 所 有 资源 文件 (声音 、 图 片 和 配置 文 。 > Waermal tibraries 
件 等 ) 都 要 放 到 该 resource 目录 下 ， 这 就 是 资源 目录 。images 
文件 夹 是 项 目 所 需 的 资源 图 片 文件 ，icon 文件 夹 是 项 目 所 需 的 
图 标 文 件 。 然 后 将 本 章 配套 资源 图 片 复制 到 项 目的 images 和 
icon 文件 夹 中 。 


提示 : 在 PyCharm 中 创建 文件 夹 步 骤 : 右 击 PetStore 根 
目录 ， 选 择 菜单 New 一 Directory, 在 弹出 对 话 框 中 输入 要 创 ” 医 E 


图 23-9 PetStore 项 目 中 resource 资 
源 目录 


建 的 文件 夹 。 v 四 com 
~ Bb zhijieketang 

、 v Pa petstore 
23.3.2” 近 代 2.2: 添加 包 ¥ 和 
参考 图 23-10 在 PetStore 项 目 中 创建 如 下 两 个 包 。 的 
。com.zhijieketang.petstore.ui: 放置 表示 层 文件 ; 入 下 
，com.zhijieketang.petstore.dao: 放置 数据 持久 层 文件 。 局 _init_py 
提示 : 在 PyCharm 中 创建 文件 夹 步 骤 : 右 击 PetStore 根 ei 


Pa images 


目录 ， 选 择 菜单 New 一 Python Package， 在 弹出 对 话 框 中 输 > 吊 Exterallibraries 
入 要 创建 的 包 名 。 


图 23-10 PetStore 项 目 包 


23.4 任务 3: 编写 数据 持久 层 代码 
项 目 创建 并 完成 初始 化 后 ， 可 以 先 编写 数据 持久 层 代码 。 


23.4.1 ” 壕 代 3.1: 数据 库 配 置 文件 


为 了 配置 项 目 方便 ， 在 PetStore 项 目 根 目录 下 创建 一 个 配置 文件 config.ini，config.ini 文 国 
件 内 容 如 下 : 了 


7 数据 库 设 置 扫 码 看 视频 
[db] 

host = 127.0.0.1 

port = 3306 

user = root 


password = 12345 
database = petstore 
charset = utf8 


目前 config.ini 文件 主要 配置 的 是 数据 库 连 接 。 


23.4.2” 壕 代 3.2: 编写 DAO 基 类 
DAO 的 主要 任务 是 对 数据 库 进行 CRUD 操作 ， 这 些 操作 需要 建立 数据 库 连接 ， 最 后 还 电 及 0 
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要 关闭 数据 连接 ， 所 以 需要 把 一 些 基本 功能 封装 一 个 DAO 基 类 中 。DAO 基 类 是 BaseDao， 
BaseDao 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter23/PetStore/com/zhijieketang/petstore/dao/base_dao.py 


wn 定义 DAO 基 类 """ 
import pymysql 
import configparser 


class BaseDao (object): 
def _ init_ (self): 
self.config = configparser.ConfigParser () 


©o 


self.config.read('config.ini', encoding='utf-8') 


host = self.config['db'] ['host'] 

user = self.config['db'] ['user'] 

# 读 取 整数 port 数据 

port = self.config.getint ('db', 'port') 
password = self.config['db'] ['password'] 
database = self.config['db'] ['database'] 
charset = self.config['db'] ['charset'] 


self.conn = pymysql.connect (host=host, 
user=user, 
port=port, 
password=password, 
database=database, 
charset=charset) 


def close(self): 
www 关闭 数据 库 连 接 """ 


self.conn.close() 


上 述 代 码 第 四 行 定 义 了 DAO 基 类 了 BaseDao， 它 直接 继承 object 类 。 代 码 第 回 行 是 
BaseDao 类 构造 方法 ， 在 该 构造 方法 中 读 取 配置 文件 信息 。 代 码 第 @ 行 是 创建 数据 库 连 接 对 象 
conn， 注 意 它 是 成 员 变量 。 代 码 第 @ 行 是 定义 close() 方法 ， 用 来 关闭 数据 库 连接 。 


23.4.3 ”六 代 3.3: 用 户 管理 DAO 
用 户 管理 AccountDao 类 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter23/PetStore/com/zhijieketang/petstore/dao/account_dao.py 


""" 用 户 管理 DAO""" 


from com.zhijieketang.petstore.dao.base dao import BaseDao 
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class AccountDao (BaseDao) : 
def _init (self): 


super()._init _() 


def findbyid(self, userid): 
account = None 
try: 
# 2。 创建 游标 对 象 
with self.conn.cursor() as cursor: 
# 3。 执行 SQL 操作 
sql = 'select userid,password,email,name,addr,city, country,phone ' \ 
"from accounts where userid =$%s"' 
cursor.execute(sql, userid) 
# 4。 提取 结果 集 


row = cursor.fetchone () 


if row is not None: 
account = {} 
account ['userid'] = row[0] 
account['password'] = row[1] 
account ['email'] = row[2] 


account['name'] row[3] 
account ['addr'] row[4] 
account['city'] = row[5] 
account['country'] = row[6] 
account['phone'] = row[7] 


# with 代码 块 结束 5。 关 闭 游标 


finally: 
# 6。 关闭 数据 连接 


self.close() 


return account 


AccountDao 继承 了 BaseDao 基 类 。 一 般 情况 下 一 个 DAO 会 有 CRUD 的 4 类 方法 ， 由 于 
本 项 目 中 只 需要 实现 findbyid(self userid) 方法 ， 具 体 代 码 不 再 装 述 。 


23.4.4” 进 代 3.4: 商品 管理 DAO 
品 管理 ProductDao 类 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter23/PetStore/com/zhijieketang/petstore/dao/account_dao.py 


""" 商品 管理 DAO™"" 


from com.zhijieketang.petstore.dao.base dao import BaseDao 


class ProductDao (BaseDao) : 
def _init (self): 


super()._init _() 
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def findall (self): 
""" 查询 所 有 商品 信息 """ 


products = [] 


try: 
# 2。 创建 游标 对 象 
with self.conn.cursor() as cursor: 
# 3。 执行 SQL 操作 
sql = 'select productid,category,cname,ename, image,listprice, ' \ 
"unitcostvdescn from products’' 

cursor.execute (sql) 

# 4。 提取 结果 集 

result_set = cursor.fetchall() 

for row in result set: 
product = {} 
product['productid'] = row[0] 
product['category'] = row[1] 
product['cname'] = row[2] 
product['ename'] = row[3] 
Product ['image'] = row[4] 
product['listprice'] = row[5] 
product['unitcost'] = row[6] 
product['descn'] = row[7] 
products.append (product) 

# with 代码 块 结束 5。 关闭 游标 

finally: 


# 6。 关闭 数据 连接 


self.close() 


return products 


def findbycat (self, catname): 
""" 按照 商品 类 别 查询 商品 """ 


products = [] 
try: 
# 2。 创建 游标 对 象 
with self.conn.cursor() as cursor: 


# 3。 执行 SQL 操作 

sql = 'select productid, category, cname,ename image, listprice, ' \ 
"unitcost,descn from products from products where category=%s" 

cursor.execute (sql, catname) 


# 4. 提取 结果 集 


result_ set = cursor.fetchall() 


for row in result set: 


# 
finally: 
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product = {} 
product['productid'] = row[0] 
product['category'] = row[1] 


product['cname'] = row[2] 
product ['ename'] = row[3] 
product['image'] = row[4] 


product['listprice'] = row[5] 
product["'unitcost'] = row[6] 
product['descn'] = row[7] 
products.append (product) 

with 代码 块 结束 5。 关 闭 游标 


# 6。 关闭 数据 连接 


self.close() 


return products 


def findbyid(self, productid): 


""" 按照 商品 


product = 
try: 


id 查询 商品 """ 


None 


# 2。 创建 游标 对 象 


with s 


elf.conn.cursor() as cursor: 


# 3。 执行 SQL 操作 
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sql = "select productid,category,cname,ename,image,listprice, ' \ 


"unitcost,descn from products from products where productid=%s' 


cursor.execute(sql, productid) 


# 4。 提取 结果 集 


row = cursor.fetchone() 


if row is not None: 
product = {} 
product['productid'] = row[0] 


product['category'] = row[1] 
product['cname'] = row[2] 
product['ename'] = row[3] 
product['image'] = row[4] 


product['listprice'] = row[5] 
product["'unitcost'] = row[6] 
product['descn'] = row[7] 


# with 代码 块 结束 5. 关闭 游标 


finally: 
# 6。 关闭 数据 连接 


self.close() 


return product 
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本 项 目 中 ProductDao 只 需要 实现 findall(selfj)、findbycat(self, catname) 和 findbyid(self， 
productid) 方法 。 


23.4.5 ”迭代 3.5: 订单 管理 DAO 
订单 管理 OrderDao 类 代码 如 下 : 


# coding=utf-8 
# 代码 文件 chapter23/PetStore/com/zhijieketang/petstore/dao/order dao.py 


wun 订单 管理 DAO""" 
import pymysql 


from com.zhijieketang.petstore.dao.base dao import BaseDao 
class OrderDao (BaseDao) : 
def _ init_ (self): 


super()._init _() 


def findall (self): 


www 查询 所 有 订单 """ 
orders = [] 
try: 

# 2。 创建 游标 对 象 


with self.conn.cursor() as cursor: 
# 3。 执行 SQL 操作 
sql = "select orderid,userid,orderdate from orders' 
cursor .execute (sql) 
# 4。 提 取 结果 集 


result_set = cursor.fetchall1() 


for row in result set: 
order = {} 
order['orderid'] = row[0] 
order['userid'] = row[1] 
order['orderdate'] = row[2] 
orders.append(order) 

# with 代码 块 结束 5。 关闭 游标 

finally: 
# 6。 关闭 数据 连接 


self.close() 


return orders 


def create(self，order) : 


""" 创建 订单 ， 插 入 到 数据 库 """ 


try: 


# 2。 创建 游标 对 象 
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with self.conn.cursor() as cursor: 
# 3。 执行 SQL 操作 
sql = 'insert into orders (orderid,userid,orderdate, status,amount) ' \ 

"values (%s,%s,%3,%3,%3)" 
affectedcount = cursor.execute (sql, order) 
print (' 成 功 插入 {0} 条 数据 ' .format (affectedcount)) 
# 4。 提交 数据 库 事务 
self.conn.commit () 
# with 代码 块 结束 5. 关闭 游标 
except pymysql.DatabaseError as e: 
# 4。 回 滚 数据 库 事务 


self.conn.rollback() 


Print(e) 
finally: 
# 6。 关闭 数据 连接 


self.close() 
本 项 目 中 OrderDao 只 需要 实现 findall(self) 和 create(self order) 函数 。 


23.4.6” 壕 代 3.6: 订单 明细 管理 DAO 
订单 明细 管理 OrderDetailDao 类 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ， chapter23/PetStore/com/zhijieketang/petstore/dao/order detail dao.py 


回 
扫 码 看 视频 


""" 订单 明细 管理 DAO""" 
import pymysql 


from com.zhijieketang.petstore.dao.base dao import BaseDao 


class OrderDetailDao (BaseDao): 
def _init (self): 
super()._ init_() 


def create(self, orderdetail): 


""" 创建 订单 详细 ， 插 入 到 数据 库 """ 


Er 

# 2。 创建 游标 对 象 

with self.conn.cursor() as cursor: 
# 3。 执行 SQL 操作 

sql = "insert into orderdetails (orderid, productid,quantity, ' \ 

'unitcost) values ($3,%3,%3,%3)" 
affectedcount = cursor.execute (sql, orderdetail) 
print(" 成 功 插入 {0} 条 数据 ' .format (affectedcount)) 


# 4。 提交 数据 库 事务 


self.conn.commit () 
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# with 代码 块 结束 5. 关闭 游标 
except pymysql.DatabaseError as e: 
# 4。 回 滚 数据 库 事务 
self.conn.rollback() 
print (e) 
finally: 
# 6。 关闭 数据 连接 


self.conn.close() 


在 本 项 目 中 OrderDetailDao 需要 实现 create(self orderdetail) 方法 。 


23.5 任务 4: 编写 表示 层 代 码 
从 客观 上 讲 ， 表 示 层 开发 的 工作 量 是 很 大 的 ， 有 很 多 细节 工作 。 


23.$.1 壕 代 4.1: 编写 启动 模块 


Python 应 用 程序 需要 有 一 个 主 模 块 ， 它 是 应 用 程序 的 入 口 ， 主 模块 文件 app_main.py 代码 
如 下 : 


eh # coding=utf-8 
# 代码 文件 :chapter23/PetStore/app_main.py 


import wx 


from com.zhijieketang.petstore.ui.login frame import LoginFrame 


class App (wx.App): 


def OnInit (self) : 
# 创建 窗口 对 象 
frame = LoginFrame() 
frame.Show() 
Feturn True 


if _name == ' main_': 
app = App() 
app.MainLoop () # 进入 主事 件 循环 


该 模块 是 主 模块 ， 程 序 启 动 时 会 调用 该 模块 ，app = App0 是 创建 wxPython 应 用 程序 ， 在 
应 用 程序 启动 时 实例 化 LoginFrame 登录 窗口 ， 并 显示 登录 窗口 。 


23.5.2 ”迭代 4.2: 编写 自 定义 窗口 类 一 一 MyFrame 


由 于 wxPython 提供 的 窗口 类 是 wxFrame， 为 了 满足 本 项 目的 需要 ， 所 以 自 定义 了 一 个 窗 
口 类 MyFrame。MyFrame 代码 如 下 : 


pa] 


扫 码 看 视频 # coding=utf-8 
# 代码 文件 : chapter23/PetStore/com/zhijieketang/petstore/ui/my_frame.py 
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"定义 Frame 窗口 基 类 """ 
import sys 


import wx 
class MyFrame (wx.Frame): @ 


# 用 户 登 录 成 功 后 ， 保 存 当前 用 户 信息 
Session = {} Q@ 


def _init (self, title, size): 

super()._ init_ (parent=None, title=title, size=size, 
Style=wx.DEFAULT FRAME STYLE ^ wx.MAXIMIZE BOX) @ 

# 设置 窗口 居中 

self.Centre() 

# 设置 Frame 窗口 内 容 面板 

self.contentpanel = wx.Panel (parent=self) @ 

ico = Wx.Icon('resources\icon\dog4.ico', wx.BITMAP TYPE ICO) 


# 设置 窗口 图 标 


self.SetIcon (ico) © 

# 设置 窗口 的 最 大 和 最 小 尺寸 

self.SetSizeHints (size, size) 

self.Bind (wx.EVT CLOSE, self.OnClose) [2) 
def OnClose(self, event): 


# 退出 系统 
self.Destroy() 
sys.exit (0) 


上 述 代 码 第 @ 行 定义 了 自 定 窗口 类 MyFrame， 直 接 继承 wx.Frame。 代 码 第 @ 行 是 声明 
Session 变量 ， 它 用 来 保存 用 户 登 录 成 功 后 的 用 户 信 息 ， 这 是 为 了 模拟 Web 应 用 开发 中 的 会 话 
(Session) 对 象 ， 等 用 户 打 开 浏 览 器 ， 登 录 Web 系统 后 ， 服 务 器 端 会 将 用 户 信 息 保存 到 会 话 对 
象 中 。 

代码 第 图 行 调 用 了 父 类 构造 方法 ， 其 中 style 参 数 是 设置 窗口 的 样式 ， 其 取 值 是 
wx.DEFAULT_ FRAME _STYLE ^ wx.MAXIMIZE BOX 表 示 wx.DEFAULT_ FRAME _STYLE 
与 wx.MAXIMIZE_BOX 进行 位 异 或 运算 ， 最 后 的 结果 是 除了 wx.MAXIMIZE_BOX (最 大 化 
按钮 ) 样式 以 外 的 样式 。 

代码 第 @ 行 为 窗口 添加 了 一 个 内 容 面板 ， 在 此 窗口 类 中 子 窗口 和 控件 都 放 入 到 该 面板 中 。 
代码 第 @ 行 是 为 窗口 设置 图 标 ， 这 样 所 有 的 窗口 都 有 相同 图 标 。 

代码 第 @ 行 的 SetSizeHints( 方法 是 设置 窗口 的 最 大 尺寸 和 最 小 尺寸 ， 而 本 例 中 最 大 尺寸 
和 最 小 尺寸 相等 ， 也 就 是 这 个 窗口 不 能 改变 大 小 ， 本 项 目 中 的 窗口 全 部 是 这 样 的 特点 。 代 码 第 
@ 行 是 为 窗口 绑 定 关闭 窗口 事件 。 当 用 户 关闭 窗口 时 ， 会 调用 OnClose(self, event) 方法 ， 见 代 
码 第 @ 行 ， 在 该 方法 中 self.Destroy0 是 释放 窗口 中 占用 资源 ，sys.exit(0) 是 退出 系统 。 


23.5.3” 壕 代 4.3: 用 户 登 录 窗口 


运行 主 模 抉 会 启动 用 户 登录 窗口 ， 界 面 如 图 23-11 所 示 ， 界 面 中 有 一 个 文本 框 、 一 个 密码 | 
框 和 两 个 按钮 。 用 户 输入 账号 和 密码 ， 单 击 “ 确 定 ”按钮 ， 如 果 输 入 的 账号 和 密码 正确 ， 则 登 要 码 看 视频 
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录 成 功 进入 商品 列表 窗口 ， 如 果 输 入 的 不 正确 ， 则 弹出 如 图 23-12 所 示 的 对 话 框 。 


(a) (b) 
图 23-11 用 户 登录 窗口 


用 户 登 录 窗 口 LoginFrame 代码 如 下 : 
# coding=utf-8 @ 你 贮 入 的 赎 到 韦 码 有 误 ， 请 重新 绽 入 。 


# 代码 文件 : chapter23/PetStore/com/zhijieketang/ 
petstore/ui/login frame.py 


CD 
图 23-12 ”用户 登录 失败 提示 


"www 用 户 登 录 窗 口 """ 
import sys 
Import wx 


from com.zhijieketang.petstore.dao.account dao import AccountDao 
from com.zhijieketang.petstore.ui.my frame import MyFrame 
from com.zhijieketang.petstore.ui.product list frame import ProductListFrame 


class LoginFrame (MyFrame): 
def _init_ (self): 
super () ._init (title="' 用 户 登 录 '，size=(340，230)) 


# 创建 界面 控件 


accountid st = Wwx.StaticText (self.contentpanel, labe 


账号 : ') 
password st = wx.StaticText (self.contentpanel, label=" 密码 : ') 
self.accountid txt = wx.TextCtrl (self.contentpanel) 

self.password txt = wx.TextCtrl (self.contentpanel, style=wx.TE PASSWORD) 


# 创建 FlexGrid 布局 fgs 对 象 
fgs = wx.FlexGridsizer(2，2，20，20) 
fgs.AddMany ([ (accountid st, 1, wx.ALIGN CENTER VERTICAL | wx.ALIGN RIGHT 
| wx.FIXED MINSIZE), 
(self.accountid txt, 1, wx.CENTER | wx.EXPAND), 
(password st, 1, wx.ALIGN CENTER VERTICAL | Wwx.ALIGN RIGHT 
| wx.FIXED MINSIZE), 
(self.password txt, 1, wx.CENTER | wx.EXPAND)]) 
# 设置 FlexGrid 布局 对 象 
fgs.AddGrowableRow (0, 1) 
fg3.AddGrowableRow (1, 1) 
fg3.AddGrowableCol (0, 1) 
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fgs.AddGrowableCol (1, 4) 


# 创建 按钮 对 象 

okb btn = wx.Button(parent=self.contentpanel，label=' 确定 ') 
self.Bind(wx.EVT_BUTTON，self.okb btn onclick, okb btn) 
cancel btn = wx.Button(parent=self.contentpanel，label=' 取消 ') 
self.Bind (wx.EVT BUTTON, self.cancel btn onclick, cancel btn) 


# 创建 水 平 Box 布局 hbox 对 象 

hbox = wx.BoxSizer (wx.HORIZONTAL) 

hbox.Add (okb btn, 1, wx.CENTER | wx.ALL | wx.EXPAND, border=10) 
hbox.Add (cancel btn, 1, Wwx.CENTER | wx.ALL | wx.EXPAND, border=10) 


# 创建 垂直 Box 布局 ， 把 fgs 和 hbox 添加 到 垂直 Box 布局 对 象 上 

Vbox = wx.BoxSizer (wx.VERTICAL) 

vbox.Add (fgs, -1, Wwx.CENTER | wx.ALL | wx.EXPAND, border=25) 
vbox.Add (hbox, -1, wx.CENTER | wx.BOTTOM, border=20) 


self.contentpanel .SetSizer (vbox) 


def okb btn onclick(self, event): [Oy) 
"…"" 确定 按钮 事件 处 理 """ 


dao = RccountDao () 
account = dao.findbyid(self.accountid txt.GetValue()) @ 
password = self.password txt.GetValue() 


if account is not None and account['password'] == password: @ 
print (' 登录 成 功 。') 
next_ frame = ProductListFrame() 
next_frame.Show() 
self.Hide() 


# 登录 成 功 保存 用 户 Session 


MYFTame.Session = account 


else: 
print (' 登录 失败 。') 
dlg = wx.MessageDialog (self,' 您 输入 的 账号 或 密码 有 误 ， 请 重新 输入 。'， 
" 登录 失败 '， 
WX.OK | wx.ICON ERROR) 
dlg.ShowModal () 
dlg.Destroy() 


@@© 


def cancel btn onclick(self, event): 


”"" 取消 按钮 事件 处 理 """ 


# 退出 系统 
self.Destroy() 
sys.exit (0) 
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上 述 代码 第 @ 行 是 单 击 确定 按钮 时 事件 处 理 方法 。 代 码 第 @ 行 是 通过 用 户 管理 DAO 对 象 
调用 findbyid0 方法 ， 该 方法 通过 用 户 账 号 查询 用 户 信息 。 

代码 第 @ 行 比较 窗口 中 输入 的 密码 与 从 数据 库 中 查询 的 密码 是 否 一 致 ， 如 果 一 致 则 成 功 登 
录 ， 否 则 登录 失败 。 失 败 时 弹出 对 话 框 ， 代 码 第 @ 行 以 wx.MessageDialog() 方法 创建 对 话 框 ， 
其 中 wx.OK | wx.ICON_ERROR 会 弹出 一 个 包含 OK 按钮 的 错误 消息 类 型 对 话 框 。 代 码 第 @ 行 
ShowModal( 是 弹出 对 话 框 。 代 码 第 @ 行 Destroy0 是 关闭 对 话 框 。 


23.S.4 ”迭代 4.4: 商品 列表 窗口 


登录 成 功 后 会 进入 商品 列表 窗口 ， 如 图 23-13 所 示 。 商 品 列表 窗口 是 分 隔 窗口 ， 左 窗口 显 
示 商 品 列表 ， 右 窗口 显示 商品 明细 信息 。 商 品 列表 窗口 是 PetStore 项 目的 最 核心 窗口 ， 在 该 窗 
后 口 可 进行 的 操作 如 下 。 


扫 码 看 视频 


于 所 二 时 并 : ~ 本 a 
人 人 大 避 中 文 各 各 站 
1 oa 亚 马 圳 旨 熙 Amazon Parrot 
2 |AV-5B-02 9 关 1 Finchl 
3 AV-S8-03 。 乌 党 2 Finch2 
4 AV-S8-04 | 久 总 3 Finch3 
5 AVSB-05 (Sa WM4 Finch6 
6 JAV-S8-06 。 马 类 S25 Finch5 
7 |FHFW-01 。 国 关 名 要 Koi 
Nati: 1s000 
[3 FHFW-02 鱼 类 金鱼 Goldfsh 
ay300000 
9 |FHSW-01 。 鱼 关 神仙 全 Angelfish 
商 旺 扬 还 ， 梅 仙 长 这 75 年 的 大 人 
10 FISW-02 。 鱼 关 磺 流 Tiger Shark 
1 FL-DLH-02 瑞 妆 让 所 Persian i | 
12 |FL-DLH-03 弄 类 时 Persian2 
es | 
ELREGT mm Mo 
Ee 


图 23-13 商品 列表 窗口 


1) 查看 商品 信息 

当 从 左 窗口 的 网 格 中 选中 某 一 个 商品 时 ， 右 窗口 会 显示 该 商品 的 详细 信息 。 

2) 选择 商品 类 型 进行 查询 

用 户 可 以 选择 商品 类 型 ， 单 击 “ 查 询 ” 按 钮 根据 商品 类 型 进行 查询 ， 如 图 23-14 所 示 为 选 
中 “ 鱼 类 ”商品 类 型 时 的 查询 结果 。 

3) 重 置 查询 

根据 商品 类 型 查询 后 ， 如 果 想 返回 查询 之 前 的 状态 ， 可 以 单 击 “ 重 置 ”按钮 重 置 商品 列表 ， 
回 到 如 图 23-13 所 示 界 面 。 

4) 添加 商品 到 购物 车 

用 户 在 商品 列表 中 选中 商品 后 ， 可 以 单 击 “ 添 加 到 购物 车 ”按钮 ， 将 选中 的 商品 添加 到 购 
物 车 中 ， 注 意 用 户 每 单 击 一 次 则 增加 一 次 该 商品 的 数量 到 购物 车 。 

5) 查看 购物 车 

用 户 单 击 “ 查 看 购物 车 ”按钮 后 窗口 会 跳 转 到 购物 车 窗口 。 


第 23 章 项 目 实战 3，PetStore 宠物 商店 项 目 | 萝 373 


Mams | Ra | asxs mene 
FFW-01 。 @ 类 。。 名 色 Wai 

FHFW-02 类 全 鱼 Goldfish 
FESWOT 鲁 类 。。 神仙 鱼 Angelfish 
FSW-02 ms。 RE Tiger Shark 


eh: #315000 


Fa: #3000.00 


六 : 考 遇 攻 达 75 和 的 大 局 


图 23-14 查询 商品 列表 


商品 列表 窗口 ProductListFrame 代码 如 下 : 


# coding=utf-8 


# 代码 文件 ， chapter23/PetStore/com/zhijieketang/petstore/ui/product list_ frame.py 


" 商品 列表 窗口 


import wx 


import wx.grid 


from 
from 
from 
from 


com.zhijieketang.petstore.dao.product dao import ProductDao 
com.zhijieketang.petstore.ui.my frame import MyFrame 
com.zhijieketang.petstore.ui.cart frame import CartFrame 
com.zhijieketang.petstore.ui.product list gridtable import ProductListGridTable 


# 商品 类 别 
CATEGORYS = [' 鱼 类 '，' 狗 类 '，' 息 行 类 '，' 猫 类 '，' 鸟 类 '] 


class ProductListFrame (MyFrame): 
def _init (self): 


super() ._init (title=' 商品 列表 窗口 '，size=(1000，700)) 


# ”购物 车 ， 键 是 选择 的 商品 Td， 值 是 商品 的 数量 
self.cart = {} 
# 选中 商品 


self.selecteddata = {} 


# 创建 DAO 对 象 

dao = ProductDao() 

# 查询 所 有 数据 

self.data = dao.findall () 
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def 


# 创建 分 隔 窗口 


splitter = wx.SplitterWindow (self.contentpanel, style=wx.SP_ 3DBORDER) 


# 创建 分 隔 窗 口中 的 左 侧面 板 
self.leftpanel = self.createleftpanel (splitter) 
# 创建 分 隔 窗 口中 的 右 侧面 板 


self.rightpanel = self.createrightpanel (splitter) 


# 设置 分 隔 窗口 左右 布局 

splitter.SplitVertically (self.leftpanel, 
self.rightpanel, 
630) 

# 设置 最 小 窗口 尺寸 

splitter.SetMinimumPaneSize(630) 


# 设置 整个 窗口 布局 是 垂直 Box 布局 
Vbox = WX.BoxSizer(wX.VERTICRL) 
self.contentpanel.SetSizer (vbox) 


# 添加 顶部 对 象 (topbox) 到 vbox 


vbox.Add (self.createtopbox(), 1, flag=wx.EXPAND | wx.ALL, border=20) 


# 添加 底部 对 象 (splitter) 到 vbox 


vbox.Add(splitter, 1, flag=wx.EXPAND | wx.ALL, border=10) 


# 在 当前 创建 (Frame 对 象 ) 创建 并 添加 默认 状态 栏 
self.CreateStatusBar () 
self.SetStatusText (' 准备 就 绪 ') 


createtopbox (self): 
""" 创建 顶部 布局 管理 器 topbox""" 


# 创建 静态 文本 


pc_st = wx.StaticText (parent=self.contentpanel, 


style=wx.ALIGN _ RIGHT) 


# 创建 按钮 对 象 


search btn = wx.Button(parent=self.contentpanel, label 


label=' 选择 商品 类 别 :'， 


" 查询 ') 


reset btn = wx.Button (parent=self.contentpanel，1label=' 重 置 ') 


choice = wx.Choice(self.contentpanel, choices=CATEGORYS, name='choice') 


# 绑 定 事件 处 理 
self.Bind (wx.EVT_ BUTTON, self.search btn onclick, 


search btn) 


self.Bind (wx.EVT BUTTON, self.reset btn onclick, reset btn) 


box = wx.BoxSizer (wx.HORIZONTAL) 
box.Addspacer (200) 


box.Add(pc_st, 1, flag=wx.FIXED MINSIZE | wx.ALL, border=10) 
box.Add (choice, 1, flag=wx.EXPAND | wx.ALL, border=5) 
box.Add (search btn, 1, flag=wx.EXPAND | wx.ALL, border=5) 
box.Add (reset btn, 1, flag=wx.EXPAND | wx.ALL, border=5) 


box.Addspacer (260) 


def 


def 
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return box 


createleftpanel (self, parent): 
""" 创建 分 隔 窗 口中 的 左 侧面 板 """ 


panel 


wx.Panel (parent) 


# 创建 网 格 对 象 
grid = wx.grid.Grid(panel 
# 绑 定 网 格 事件 处 理 


name= "grid') 
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self.Bind(wx.grid.EVT_GRID_LRBEL_LEFT_CLICK，self.selectrow_handler) 
self.Bind(wx.grid.EVT_GRID_CELL_LEFT_CLICK，self.selectrow_handler) 


# 初始 化 网 格 
self.initgrid() 


# 创建 水 平 Box 管理 管理 

box = WX.BoxSizer() 

# 设置 水 平 Box 管理 管理 网 格 grid 

box.Add (grid, 1, flag=wx.ALL, border=5) 
panel.SetSizer (box) 


return panel 


initgrid(self): 
""" 初始 化 网 格 对 象 """ 


# 通过 网 格 名 称 获得 网 格 对 象 
grid = self.FindWindowByName ('grid') 


# 创建 网 格 中 所 需 的 表格 
table ProductListGridTable (self.data) 
# 设置 网 格 的 表格 属性 

grid.SetTable (table, 


True) 


rowsizeinfo wx.grid.GridSizesInfo(40, 
# 设置 网 格 所 有 行 高 


grid.SetRowSizes (rowsizeinfo) 


[]) 


colsizeinfo wx.grid.GridSsizesInfo(0, 
# 设置 网 格 所 有 列 宽 
grid.SetColSizes (colsizeinfo) 


# 设置 单元 格 默认 字体 


[100, 80, 


130, 200]) 


grid.SetDefaultCellFont (wx.Font (11, wx.FONTFAMILY DEFAULT, 
Wx. FONTSTYLE_NORMAL, 
Wx.FONTWEIGHT_NORMAL，faceName=' 微软 雅 黑 ') ) 


# 设置 行 和 列 标题 的 默认 字体 


grid.SetLabelFont (wx.Font (9, wx.FONTFAMILY DEFAULT, 


WX.FONTSTYLE NORMAL, 


Wx.FONTWEIGHT_NORMAL，faceName="' 微软 雅 黑 ')) 


# 设置 网 格 选择 模式 为 行 选择 


grid-SetSelectionMode (grid.wxGridSelectRows) 
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# 设置 不 能 通过 拖 动 改 变 行 高 度 
grid.DisableDragRowSize() 
# 设置 不 能 通过 拖 动 改 变 列 宽度 


grid.DisableDragColSize() 


def createrightpanel (self, parent): 


""" 创建 分 隔 窗口 中 的 右 侧面 板 """ 


panel = wx.Panel (parent, style=wx.TAB TRAVERSAL | wx.BORDER DOUBLE) 
panel .SetBackgroundColour (wx .WHITE) 


# 显示 第 一 张 图片 

imagepath = 'resources/images/' + self.data[0]['image'] 

image = wx.Bitmap (imagepath, wx.BITMAP_ TYPE ANY) 

image_ sbitmap = wx.StaticBitmap (panel, bitmap=image, name="'image sbitmap') 


# 商品 市 场 价格 
slistprice = " 商品 市 场 价 : ¥¥{0: .2f}".format (self.data[0]['listprice']) 
listprice st = wx.StaticText (panel, label=slistprice, name='listprice') 


# 市 场 价格 

sunitcost = " 商品 单价 : ¥{0:.2f}".format (self.data[0] ['unitcost']) 
unitcost_ st = wx.StaticText (panel, label=sunitcost, name='unitcost') 
# 商品 描述 


descn =" 商品 描述 : {0}".format (self.data[0]['descn']) 
descn st = wx.StaticText (panel, label=descn, name 


descn') 


# 创建 按钮 对 象 

addcart_btn = wx.Button (panel，1label=' 添加 到 购物 车 ') 

seecart_btn = wx.Button (panel，1abe1l=' 查看 购物 车 ') 

# 绑 定 事件 处 理 

self.Bind(wx.EVT_BUTTON， self.addcart btn onclick, addcart btn) 
self.Bind (wx.EVT BUTTON, self.seecart btn onclick, seecart btn) 


# 创建 垂直 Box 布局 管理 器 

box = wx.BoxSizer (wx.VERTICAL) 

box.aAddSpacer (50) 

box.Add (image_sbitmap，1，fag=wx.CENTER | Wx.ALL, border=30) 
box.aAddSpacer (50) 

box.Add (listprice st, 1, flag=wx.EXPAND | wx.ALL, border=10) 
box.Add (unitcost_ st, 1, flag=wx.EXPAND | Wwx.ALL, border=10) 
box.Add(descn_st, 1, flag=wx.EXPAND | wx.ALL, border=10) 
box.AddSpacer (20) 

box.Add (addcart_ btn, | wx.ALL, borde. 
box.Add (seecart_btn, 1, flag=wx.EXPAND | wx.ALL, border=10) 


panel .Setsizer (box) 


return panel 


def search btn onclick(self, event): 


""" 查询 按钮 事件 处 理 """ 


def 


def 


def 
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# 通过 名 称 查询 choice 控件 
choice = self.FindWindowByName ('choice') 
# 获得 选中 类 别 索 引 
selectcatidx = choice.GetSelection() 
if selectcatidx >= 0: 
# 获得 选中 的 商品 类 别 
catname = CATEGORYS[selectcatidx] 


# 根据 类 别 查询 商品 

dao = ProductDao () 

self.data = dao.findbycat (catname) 
# 初始 化 网 格 

self.initgrid() 


reset btn onclick(self, event): 


"nn 重 置 按钮 事件 处 理 """ 


# 查询 所 有 商品 

dao = ProductDao() 
self.data = dao.findall() 
# 初始 化 网 格 
self.initgrid() 


addcart btn_ onclick(self, event): 


""" 添加 到 购物 车 事件 处 理 """ 


if lenl(self.selecteddata) == 
self.SetStatusText (' 请 先 选择 商品 ') 


return 


# 获得 选择 的 商品 id 

productid = self.selecteddata['productid'] 

if productid in self.cart.keys(): # 判断 购物 车 中 已 经 有 该 商品 
# 获得 商品 数量 
quantity = self.cart[productid] 
self.cart[productid] = (quantity + 1) 

else: ## 购物 车 中 还 没有 该 商品 


self.cart[productid] = 1 


# 显示 在 状态 栏 
self.SetStatusText(' 商品 {0} 添加 到 购物 车 ' .format (productid)) 
print (self.cart) 


seecart_ btn onclick(self, event): 


""" 查看 添加 到 购物 车 事件 处 理 """ 


next frame = CartFrame (self.cart, self) 
next_frame-Show() 
self.Hide() 


@@ eo 


E) 
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def selectrow handler (self, event): 
""" 选择 网 格 行事 件 处 理 """ 


srowidx = event .GetRow() 

if srowidx >= 0: 
print (self.data[srowidx]) 
self.selecteddata = self.data[srowidx] 
self.SetStatusText(' 选择 第 {0} 行 数 据 ' .format (srowidx + 1)) 


# 显示 选择 的 图 片 

imagepath = "Tesources/images/" + self.selecteddata['image'] 
image = wx.Bitmap (imagepath, wx.BITMAP TYPE ANY) 

# 通过 名 称 查 询 子 窗口 

image sbitmap = self.FindWindowByName ('image sbitmap') 
image_ sbitmap.SetBitmap (image) 


# 商品 市 场 价格 

slistprice = "商品 市 场 价 ¥{0:.2f}".format (self.selecteddata['listprice']) 
listprice st = self.FindWindowByName('listprice') 

listprice st.SetLabelText (slistprice) 


# 市 场 价格 

sunitcost = " 商品 单价 : ¥¥{0: .2f}".format (self.selecteddata['unitcost']) 
unitcost st = self.FindWindowByName ('unitcost') 

unitcost st.SetLabelText (sunitcost) 


# 商品 描述 

descn = " 商品 描述 : {0}".format (self.selecteddata['descn']) 
descn st = self.FindWindowByName ('descn') 

descn_ st.SetLabelText (descn) 


self.rightpanel .Layout () 


event .Skip() 


上 述 代 码 第 @ 行 定义 的 addcart_btn_onclick(self, event) 方法 是 用 户 单 击 “ 添 加 到 购物 车 ” 
按钮 的 事件 处 理 代码 ， 其 中 代码 第 @ 行 判断 了 selecteddata 成 员 变 量 中 是 否 有 数据 ， 这 是 为 了 
防止 用 户 没有 选择 网 格 行 时 ， 就 单 击 查 看 购物 车 按钮 。 代 码 第 @ 行 是 获得 选择 的 商品 id。 代 码 
第 @ 行 是 判断 购物 车 中 是 否 已 经 有 了 选中 的 商品 ， 如 果 有 则 通过 代码 第 @ 行 取出 商品 数量 ， 代 
码 第 @ 行 是 将 商品 数量 加 一 后 ， 再 重新 放 回 到 购物 车 中 。 如 果 没有 商品 则 将 该 商品 添加 到 购物 
车 中 ， 商 品 数量 为 1， 见 代码 第 @ 行 。 

代码 第 @ 行 是 单 击 “ 查 看 购物 车 ”按钮 时 事件 处 理 代码 块 。 此 时 当前 界面 会 调转 到 购物 车 
窗口 。 

代码 第 @ 行 是 用 户 选 中 网 格 中 某 一 行 时 调用 的 方法 ， 在 这 里 根据 用 户 选中 的 商品 更 新 右边 
窗口 的 详细 商品 信息 。 

商品 列表 窗口 中 使 用 了 自 定义 GridTableBase 类 ProductListGridTable， 其 代码 如 下 。 
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# coding=utf-8 
# 代码 文件 chapter23/PetStore/com/zhijieketang/petstore/ui/product list gridtable.py 


""" 自 定义 GridTableBase 类 ， 用 于 商品 网 格 """ 


import wx.grid 


# 商品 网 格 列 名 
COLUMN_NAMES = [' 商品 编号 "'，“' 商品 类 别 '，' 商品 中 文 名 '，，' 商品 英文 名 '] 


class ProductListGridTable (wx.grid.GridTableBase): 
def _init (self, data): 
super()._init __() 
self.colLabels = COLUMN NAMES 
self.data = data 


def GetNumberRows (self): 
return len(self.data) 


def GetNumberCols (self): 
return len(COLUMN NAMES) 


def GetValue (self, rowidx, colidx): [Oy 
product = self.data[rowidx] @ 
if colidx == 0: @ 
return product['productid'] 
elif Golidx == 1 
return product['category'] 
elif colidx == 2: 
return product['cname'] 
else: 
return product['ename'] @ 


def GetColLabelValue (self, colidx): 
return self.colLabels[colidx] 


上 述 代 码 第 Q@ 行 GetValue(self, rowidx, colidx) 方法 根据 行 和 列 索 引 返 回 数据 ， 其 中 代码 第 
@@ 行 是 根据 行 索引 获得 商品 对 象 ， 代 码 第 @@ 行 和 第 图 行 是 根据 列 索引 返回 商品 对 应 的 属性 。 


23.5.5” 壕 代 4.5: 商品 购物 车 窗口 


当 用 户 在 商品 列表 窗口 单 击 了 “查看 购物 车 ”按钮 ， 则 会 跳 转 到 商品 购物 车 窗口 ， 如 图 回 
23-15 所 示 。 在 该 窗口 可 进行 的 操作 有 如 下 几 种 。 
1) 返回 商品 列表 he 
当 用 户 单 击 “ 返 回 商品 列表 ”按钮 时 ， 界 面 跳 转 回 上 一 级 窗口 〈 商 品 列表 窗口 )， 用 户 还 可 
以 重新 添加 新 的 商品 到 购物 车 。 
2) 修改 商品 数量 
用 户 如 果 想 修改 商品 数量 ， 可 以 在 购物 车 网 格 中 双击 某 一 商品 数量 单元 格 ， 使 其 进入 编辑 
状态 。 用 户 只 能 输入 大 于 0 的 数值 ， 不 能 输入 负数 或 非 数值 字符 。 
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[ [ Was mae a nate 
1 AV-SB-05 m4 11000 1 T1000 
| fswol 神仙 生 400.00 2 800.00 
love 于 262000 0 sa 
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jnro 全 大 3400.00 1 3400.00 
slap-LkoT i 2203.00 1 2203.00 
| 
| 
Ee] 
图 23-15 商品 购物 车 窗口 
3) 提交 订单 


如 果 商 品 选择 完成 ， 用 户 想 提交 订单 ， 可 以 单 击 “ 提 
交 订 单 ” 按 钮 生成 订单 ， 订 单 生 成 后 会 在 数据 库 中 插入 订 @ meeaa snr. 
单 信息 和 订单 明细 信息 。 然 后 会 弹出 如 图 23-16 所 示 订 单 | 
等 待 付款 的 确认 对 话 框 ， 如 果 用 户 单 击 “ 是 ”按钮 则 进入 
付款 流程 ， 由 于 付款 需要 实际 的 支付 接口 ， 因 此 付款 功能 图 23-16 订单 生成 确认 对 话 框 
未 实现 。 如 果 用 户 单 击 “ 否 ” 则 退出 系统 。 

商品 购物 车 窗口 CartFrame 代码 如 下 : 


# coding=utf-8 


[Wr 


# 代码 文件 : chapter23/PetStore/com/zhijieketang/petstore/ui/cart_frame.py 


"…"" 商品 购物 车 窗口 """ 
import datetime 
import sys 

import wx 


from com.zhijieketang.petstore.dao.order dao import OrderDao 

from com.zhijieketang.petstore.dao.order detail dao import OrderDetailDao 
from com.zhijieketang.petstore.dao.product_dao import ProductDao 

from com.zhijieketang.petstore.ui.cart gridtable import CartGridTable 


from com.zhijieketang.petstore.ui.my frame import MyFrame 


class CartFrame (MyFrame): 
def _init (self, cart, product list frame): 
super () ._init (title=' 商品 购物 车 '，size=(1000，700)) 


# ”购物 车 ， 键 是 选择 的 商品 Td， 值 是 商品 的 数量 


第 23 章 ”项 目 实战 3，PetStore 宠物 商店 项 目 | 其 381 


self.cart = cart 


self.product list frame = product list frame 


# 加 载 数 据 到 data 
self.data = self.loaddata() [0 


# 设置 整个 窗口 布局 是 垂直 Box 布局 
Vbox = Wwx.BoxSizer (wx.VERTICAL) 
self.contentpanel.SetSizer (vbox) 


# 添加 顶部 对 象 (topbox) 到 vbox 

vbox.Add (self.createtopbox(), 1, flag=wx.EXPAND | wx.ALL, border=10) 

# 添加 底部 对 象 (grid) 到 vbox 

vbox.Add (self.creategrid(), 1, flag=wx.CENTER | wx.FIXED MINSIZE | wx.ALL, 
border=10) 


# 为 当前 Frame 对 象 添加 默认 状态 栏 
self.CreateStatusBar () 
self.SetStatusText (' 准备 就 绪 ') 


def creategrid(self) : 
""" 创建 购物 车 表格 """ 


# 创建 网 格 对 象 


grid = wx.grid.Grid(self.contentpanel, name='grid') 


# 初始 化 表格 

# 创建 网 格 中 所 需 的 表格 

table = CartGridTable(self.data) 
# 设置 网 格 的 表格 属性 

grid.SetTable (table, True) 
grid.SetSize(1000，600) 


rowsizeinfo = wx.grid.GridSizesInfo(40，[]) 
# 设置 网 格 所 有 行 高 
grid.SetRowSizes (rowsizeinfo) 
colsizeinfo = wx.grid.GridSsizesInfo(176, []) 
# 设置 网 格 所 有 列 宽 
grid.SetColSizes (colsizeinfo) 
# 设置 单元 格 默认 字体 
grid.SetDefaultCellFont (wx.Font (11, wx.FONTFAMILY DEFAULT, 
WX.FONTSTYLE NORMAL, 
Wx.FONTWEIGHT_NORMAL，faceName=' 微软 雅 黑 ') ) 
# 设置 行 和 列 标题 的 默认 字体 
grid.SetLabelFont (wx.Font (9, Wwx.FONTFAMILY DEFAULT, 
WX.FONTSTYLE NORMAL, 
Wx.FONTWEIGHT_NORMAL，faceName="' 微软 雅 黑 ')) 
# 设置 表格 选择 模式 为 行 选择 
grid.SetSelectionMode (grid.wxGridSelectRows) 
# 设置 不 能 通过 拖 动 改变 行 高 度 


grid.DisableDragRowsize() 
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# 设置 不 能 通过 拖 动 改变 列 宽度 


grid.DisableDragColsize() 
return grid 


def createtopbox (self) : 
""" 创建 顶部 布局 管理 器 topbox""" 


# 创建 按钮 对 象 
return btn = wx.Button (Parent=self.contentpane1l，1label=' 返回 商品 列表 ' ) 
提交 订单 ') 


submit btn = wx.Button(parent=self.contentpanel, label= 
# 绑 定 事件 处 理 

self.Bind(wx.EVT_BUTTON， self.return btn onclick, return btn) 
self.Bind (wx.EVT BUTTON, self.submit btn onclick, submit btn) 


box = wx.BoxSizer (wx.HORIZONTAL) 

box.AddSpacer (350) 

box.Add (return btn, 1, flag=wx.EXPAND | wx.ALL, border=10) 
box.AddSpacer (20) 

box.Add(submit btn, 1, flag=wx.EXPAND | wx.ALL, border=10) 
box.AddSpacer (350) 


return box 


def loaddata (self): 
""" 根据 购物 车 中 保存 的 商品 id 查询 出 商品 的 其 他 属性 """ 


data = [] 
keys = self.cart.keys() 
for productid in keys: 
# 创建 DAO 对 象 
dao = ProductDao () 
product = dao.findbyid(productid) 


ow = {3 

row['productid'] = product['productid'] # 商品 编号 
row['cname'] = product['cname'] # 商品 名 
row['unitcost'] = product['unitcost'] # 商品 单价 
row['quantity'] = self.cart[productid] # 数量 

# 计算 商品 应 付 金额 

amount = row['unitcost'] * row['quantity'] 

row['amount'] = amount # 商品 应 付 金额 


data.append (row) 


return data 


def return btn onclick(self, event): 


""" 返回 商品 列表 按钮 事件 处 理 """ 


# 更 新 购物 车 
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for gridrowdata in self.data: 
productid = gridrowdata['productid'] # 商品 编号 
quantity = gridrowdata['quantity'] # 数量 
self.cart[productid] = quantity 


self.product list frame.Show() 
self.Hide() 


def submit btn onclick(self, event): 加 
""" 提交 订单 按钮 事件 处 理 """ 


# 生成 订单 


self.generateorders () 


dlg = wx.MessageDialog (self,，' 订单 已 经 生成 ， 等 待 付款 。'， 
' 信息 '， 
WX.YES_ NO | wx.ICON_ INFORMATION) 


if dlg.ShowModal() == wx.ID YES: 
# TODO 等 待 付款 
print (' 等 待 付款 ...') 


pass 
# 退出 系统 
self.Destroy() 
sys.exit (0) 
dlg.Destroy() 

def generateorders (self): 加 
"mn 生成 订单 "ww 


orderdate = datetime.datetime.today() 


# 从 用 户 session 中 取出 用 户 id 


userid = MyFrame.Session['userid'] @ 
orderid = int(orderdate.timestamp() * 1000) © 
status = 0 

amount = self.getorderamount () 

order = orderid, userid, orderdate, status, amount 

# 下 订单 时 间 由 数据 库 自动 生成 ， 不 用 设置 

# 创建 订单 

orderdao = OrderDao () 

orderdao .create (order) 


for row in self.data: 
orderdetail = orderid, row['productid'], row['quantity'], row['unitcost'] 
orderdetaildao = OrderDetailDao() 
# 创建 订单 明细 


orderdetaildao.create (orderdetail) @ 
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def getorderamount (self) : 


""" 计算 订单 应 付 总 金额 """ 


totalamount = 0.0 
for row in self.data: 


totalamount += float (row['amount']) 


return totalamount 


上 述 代 码 第 Q@ 行 调用 了 self.loaddata() 方法 加 载 数据 ， 该 方法 根据 购物 车 中 保存 的 商品 id 
查询 出 商品 的 其 他 属性 。 代 码 第 @ 行 是 用 户 单 击 “ 提 交 订 单 ” 按 钮 时 调用 的 方法 。 在 该 代码 块 
中 首先 调用 self generateorders() 方法 生成 订单 ， 然 后 通过 调用 wx.MessageDialog() 构造 方法 
创建 付款 确认 对 话 框 。 
代码 第 @ 行 是 定义 生成 订单 的 generateorders(self) 方法 ， 在 该 方法 中 将 订单 信息 插入 到 数 
据 库 订单 表 和 订单 明细 表 中 。 其 中 代码 第 图 行 是 从 用 户 Session 中 取出 用 户 id， 代 码 第 @ 行 是 
生成 订单 4， 订单 14 生成 规则 是 当前 系统 时 间 毫 秒 数 。 代 码 第 @ 行 是 将 订单 数据 插入 到 数据 
库 中 ， 由 于 订单 中 有 可 能 有 多 个 商品 ， 所 以 代码 第 @ 行 循环 插入 订单 明细 数据 。 

订单 生成 后 可 以 在 数据 中 查看 生成 的 结果 ， 如 图 23-17 所 示 。 


MySQL 5.7 Command Line client -Unicode 


图 23-17 订单 生成 数据 
购物 车 窗口 中 会 用 到 购物 车 网 格 ， 购 物 车 网 格 比 较 复 杂 ， 用 户 可 以 修改 数量 这 一 列 ， 其 他 


的 列 不 能 修改 ， 且 修改 的 数量 是 要 验证 的 ， 不 能 小 于 0， 更 不 能 输入 非 数 值 字符 。 这 些 需 求 的 
解决 是 通过 自 定 义 GridTableBase 类 一 一 CartGridTable，CartGridTable 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter23/PetStore/com/zhijieketang/petstore/ui/cart gridtable.py 


""" 自 定义 GridTableBase 类 ， 用 于 购物 车 网 格 """ 


import wx.grid 


# 购物 车 网 格 列 名 
COLUMN_NAMES = [' 商品 编号 '，' 商品 名 '，' 商品 单价 '，' 数量 '，“' 商品 应 付 金额 '] 
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class CartGridTable (wx.grid.GridTableBase) : 
def _init (self, data): 
super()._init _() 
self.colLabels = COLUMN NAMES 
self.data = data 


def GetNumberRows (self): 
return len(self.data) 


def GetNumberCols (self): 
return len(COLUMN NAMES) 


def GetValue (self, rowidx, colidx): 

product = self.data[rowidx] 
if colidx == 0: 

return product['productid'] 
elif colidx == 

return product['cname'] 
elif colidx == 2: 

return product['unitcost'] 
elif colidx == 

return product['quantity'] 
else: 

return product['amount'] 


def GetColLabelValue (self, colidx): 
return self.colLabels[colidx] 


def SetValue (self, rowidx, colidx, value): 
# 只 允许 修改 数量 列 
if colidx != 3: 


return 


# 获得 商品 数量 
try: 

quantity = int(value) @ 
except: 

# 输入 非 数字 数据 则 不 能 修改 


return 


# 商品 数量 不 能 小 于 0 


if quantity < 0: @ 
return 
# 更 新 数量 列 


self.data[rowidx]['quantity'] = quantity 
# 计算 商品 应 付 金额 

amount = self.data[rowidx]['unitcost'] * quantity 
# 更 新 商品 应 付 金额 列 


self.data[rowidx] ['amount'] = amount @ 
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在 修改 数量 时 需要 进行 验证 ， 则 需要 重 写 代码 第 @ 行 的 SetValue() 方法 ， 其 中 value 参数 
是 当前 单元 格 (rowidx，colidx) 的 输入 值 。 代 码 第 @ 行 要 判断 数量 列 才 进行 处 理 。 代 码 第 @ 
行将 输入 值 value 转换 为 整数 ， 如 果 是 非 数 值 字符 会 发 生 异常 ， 则 返回 该 方法 。 代 码 第 @ 行 是 
判断 小 于 0 时 ， 返 回 该 方法 。 代 码 第 @ 行 是 更 新 data 中 对 应 数量 列 。 代 码 第 @ 行 是 计算 商品 
应 付 金 额 。 代 码 第 @ 行 是 更 新 商品 应 付 金额 列 。 


23.6 任务 5: 发 布 可 执行 文件 


程序 编写 完成 后 需要 发 布 ， 发 布 有 两 种 形式 : 库 文件 形式 和 可 执行 文件 形式 。 库 文件 形式 
发 布 是 其 他 程序 员 使 用 的 ， 可 以 使 用 Distutils 工具 发 布 ，Distutils 用 来 在 Python 环境 中 构建 
和 安装 额外 的 模块 。 而 发 布 为 可 执行 文件 形式 是 给 最 终 用 户 使 用 的 ， 但 这 些 应 用 程序 应 该 是 有 
用 户 界面 的 ， 发 布 可 执行 可 以 使 用 PyInstaller 工具 。 由 于 本 章 介 绍 的 PetStore 项 目 是 给 一 般 用 
户 使 用 的 ， 需 要 发 布 成 为 可 执行 文件 ， 本 节 介 绍 如 何 将 PetStore 发 布 为 可 执行 文件 。 


23.6.1 友 代 5$.1: 处 理 TODO 任务 


在 最 后 发 布 之 前 ， 还 需要 处 理 一 些 任 务 ， 其 中 首先 应 该 处 理 代码 中 的 TODO 注释 任务 ， 
;有关 这 种 注释 的 详细 解释 请 参考 5.2.4 节 。 通 过 PyCharm 工具 打开 PetStore 项 目 TODO 视图 ， 
如 图 23-18 所 示 。 
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图 23-18 TODO 视图 


23.6.2 ”迭代 5.2: 发 布 为 可 执行 文件 


如 果 TODO 等 任务 都 已 经 检查 并 修正 ， 就 可 以 发 布 了 。PyInstaller 工具 官网 是 http://www. 
yinstaller.org，PylInstaller 工具 安装 可 以 使 用 pip 工具 ， 安 装 指令 如 下 : 


回 
扫 码 看 视频 pip install pyinstaller 


在 Windows 平台 下 执行 pip 安装 指令 的 过 程 如 图 23-19 所 示 ， 最 后 会 有 安装 成 功 提示 ， 其 他 平 
台 安装 过 程 也 是 类 似 的 ， 这 里 不 再 獒 述 。 
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三 cwindowssrstemazemd exe 


图 23-19 ”pip 工具 安装 PyInstaller 


安装 完成 PyInstaller 工具 ， 就 可 以 发 布 了 ， 最 简单 的 命令 如 下 : 

pyinstaller < 主 模块 >.pPy 

一 个 应 用 程序 可 能 包含 多 个 “ .py” 模 块 文件 ， 但 其 中 只 有 一 个 主 模块 文件 。 使 用 此 命令 
不 能 包含 资源 文件 ， 而 PetStore 项 目 中 包含 配置 文件 、 图 标 文件 和 图 片 文件 等 资源 。 为 了 包含 
这 些 资源 文件 可 以 自 定义 规范 文件 〈spec file)， 那 么 如 何 编写 规范 文件 呢 ? 可 以 pyi-makespec 
命令 生成 规范 文件 ， 本 项 目的 主 模 块 是 app_main.py， 使 用 命令 如 下 : 


pyi-makespec app_main.py 


然后 在 当前 目录 下 生成 app_main.spec 文件 ，app_main.spec 文件 内 容 如 下 : 


# -*- mode: python 一 * 一 


block_cipher = None 


a = Analysis(['app_main.py'], 
pathex=['E:\\PetStore'], 
binaries=[], 
datas=[]， @ 


hiddenimports=[], 
hookspath=[], 
runtime hooks=[], 
excludes=[], 
win no_prefer redirects=False, 
win private assemblies=False, 
cipher=block_cipher) 
pyz = PYZ (a.pure, a.zipped data, 
cipher=block cipher) 
exe = EXE(pyz, 
a.scripts, 
exclude binaries=True, 
name='app_main', 


debug=False, 
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strip=False, 
upx=True, 
console=True ) 
coll = COLLECT (exe, 
a.binaries, 
a.zipfiles, 
a.datas, 
strip=False, 
upx=True, 
name="'app_main') 


在 文件 中 代码 第 @ 行 的 datas 变量 可 以 设置 要 添加 的 资源 文件 。 修 改 app_main.spec 文件 
内 容 如 下 : 


# -*- mode: python -*-— 
block_ cipher = None 


added files = [ 
('resources', 'resources'), 
和 “eonlg aL. 


] OO 


a = Analysis(['app_main.py'], 
pathex=['E:\\PetStore'], 
binaries=[]， 
datas=added files， @ 
hiddenimports=[], 
hookspath=[]， 
runtime hooks=[], 
excludes=[], 
win no_prefer redirects=False, 
win private assemblies=False, 
cipher=block cipher) 


pyz = PYZ (a.pure, a.zipped data, 
cipher=block cipher) 
exe = EXE(pyz, 


a.scripts, 
exclude binaries=True, 
name='app_main', 
debug=False, 
strip=False, 
upx=True, 
console=True ) 
coll = COLLECT (exe, 
a.binaries, 
a.zipfiles, 
a.datas, 
strip=False, 
upx=True, 


name="app_main') 
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代码 第 @@ 行 将 added_files 赋值 给 了 datas 变量 。 代 码 第 四 行 定义 了 added_files 变量 ， 
中 元 素 都 是 元 组 类 型 。 元 组 中 有 两 个 元 素 ， 元 组 第 一 个 元 素 是 资源 文件 或 文件 夹 ， 元 组 第 二 个 
元 素 是 在 发 布 包 中 的 位 置 ， 例 如 (resources', 'resources') 是 将 当前 目录 下 的 resources 文件 夹 复 
制 到 发 布 包 中 的 resources 文件 夹 中 ， 又 例如 ('config.ini', '.' ) 是 将 当前 目录 下 的 config.ini 文 
件 复 制 到 发 布 包 的 根 目录 下 。 

修改 好 app_main.spec 文件 后 执行 如 下 命令 : 


pyinstaller app_main.spec 


执行 过 程 如 图 23-20 所 示 ， 执 行 最 后 会 有 成 功 或 错误 提示 信息 。 


— windowstSpstemINemd exe 


图 23-20 ”执行 命令 
如 果 发 布 成 功 则 会 在 当前 目录 下 生成 dist 文件 夹 ， 如 图 23-21 所 示 。 在 dist 文件 夹 下 还 
有 app_main 文件 夹 ， 这 是 该 项 目的 名 ， 其 中 app_main.exe 就 是 所 需要 的 可 执行 文件 。 另 外 ， 
resources 文件 夹 和 config.ini 文件 是 额外 添加 的 资源 文件 。 


图 23-21 发 布 成 功 目录 结构 


打包 文件 生成 之 后 双击 app_main.exe 就 可 以 运行 了 。 


回 
要 码 看 视频 


回 
扫 码 看 视频 


项 目 实战 4: 开发 Python 版 


人 QQ2006 聊天 工具 


上 一 章 开 发 的 PetStore 宠物 商店 项 目 没有 涉及 多 线程 和 网 络 通信 ， 本 章 介 绍 的 QQ2006 聊 
天 工具 会 涉及 这 方面 的 技术 。 

本 章 介绍 通过 Python 语言 实现 的 QQ2006 聊天 工具 项 目 ， 所 涉及 的 知识 点 有 面向 对 象 、 
Lambda 表达 式 、wxPython 图 形 用 户 界面 、 访 问 数据 库 、 线 程 和 网 络 通信 等 ， 其 中 还 会 用 到 很 
多 Python 基础 知识 。 


24.1 系统 分 析 与 设计 


本 节 对 QQ2006 聊天 工具 项 目 进行 分 析 和 设计 ， 其 中 设计 过 程 包括 原型 设计 、 数 据 库 设 计 
和 系统 设计 。 


24.1.1 项 目 概述 


QQ2006 是 一 个 网 络 即 时 聊天 工具 ， 即 时 聊天 工具 是 可 以 在 两 名 或 多 名 用 户 之 间 传 递 即 时 
消息 的 网 络 软件 ， 大 部 分 的 即时 聊天 软件 都 可 以 显示 联络 人 名 单 ， 并 能 显示 联络 人 是 否 在 线 ， 
聊天 者 发 出 的 每 一 句 话 都 会 显示 在 双方 的 屏幕 上 。 即 时 聊天 工具 主要 有 以 下 几 种 。 

"ICQ : 最 早 的 网 络 即时 通信 工具 。1996 年 三 个 以 色 列 人 维 斯 格 、 瓦 迪 和 高 德 芬 格 一 起 开 

发 了 ICQ 工具 。ICQ 支持 在 Internet 上 聊天 、 发 送 消息 和 文件 等 。 

。QQ: 国内 最 流行 的 即时 通信 工具 之 一 。 

。 MSN Messenger: 是 微软 所 开发 ， 曾 经 在 公司 中 广泛 使 用 。 

。 百 度 HI: 百度 公司 推出 的 一 款 集 文字 消息 、 音 视频 通话 、 文 件 传输 等 功能 的 即时 通信 软件 。 

。 阿里 旺旺 : 阿里 巴巴 公司 为 自己 旗下 产品 用 户 定制 的 商务 沟通 软件 。 

。 Gtalk: Google 的 即时 通信 工具 。 

。Skype: 网 络 即时 语音 沟通 工具 。 

。 微 信 : 基于 移动 平台 的 即时 通信 工具 。 


24.1.2 需求 分 析 


QQ2006 项 目 工具 分 为 客户 端 和 服务 器 端 ， 客 户 端 和 服务 器 端 都 提供 了 很 多 工作 线程 ， 这 
些 线程 用 来 帮助 后 台 进行 通信 等 处 理 。 
客户 端 由 聊天 用 户 和 工作 线程 完成 工作 ， 客 户 端 主要 功能 如 下 。 
“ 用户 登 录 : 用 户 打开 登录 窗口 ， 单 击 “ 登 录 ” 按 钮 登录 。 客 户 端 工作 线程 向 服务 器 发 送 
户 登录 请 求 消息 ， 客户 端 工 作 线 程 接收 到 服务 器 端 返回 信息 ， 如 果 成 功 界面 跳 转 ， 否 


5 
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则 弹出 提示 框 ， 提 示 用 户 登 录 失 败 。 

打开 聊天 对 话 框 : 用 户 双击 好 友 列表 中 的 好 友 ， 打 开 聊 天 对 话 框 。 

“显示 好 友 列表 : 当 用 户 登 录 成 功 后 ， 客 户 端 工作 线程 接收 服务 器 端 数据 ， 根 据 数据 显示 
好 友 列表 。 

“刷新 好 友 列表 : 每 一 个 用 户 上 线 〈 登 录 成 功 )， 服 务 器 端 会 广播 用 户 上 线 消息 ， 客 户 端 工 
作 线 程 接收 到 用 户 上 线 消息 后 则 将 好 友 列表 中 好 友 在 线 状 态 更 新 。 

“向 好 友 发 送 消息 : 用 户 在 聊天 对 话 框 中 发 送 消息 给 好 友 ， 服 务 器 端 工 作 线程 接收 到 这 个 
消息 后 ， 转 发 给 用 户 好 友 。 

* 接收 好 友 消息 : 客户 端 工作 线程 接收 好 友 消息 ， 这 个 消息 是 服务 器 端 转发 的 。 

用 户 下 线 : 单 击 好 友 列 表 的 关闭 窗口 ， 则 用 户 下 线 。 客 户 端 工作 线程 向 服务 器 发 送 用 户 
下 线 消 息 。 

采用 用 例 分 析 方法 描述 客户 端 用 例 图 ， 如 图 24-1 所 示 。 


接收 好 友 消 息 


客户 端 工作 线程 


刷新 好 友 列 表 
图 24-1 QQ2006 项 目 客户 端 用 例 图 


服务 器 端 所 有 功能 都 是 通过 服务 线程 完成 的 ， 没 有 人 为 操作 ， 服 务 器 端 主要 功能 如 下 。 
"客户 用 户 登 录 : 客户 端 用 户 发 生 登 录 请 求 ， 服 务 器 端 工作 线程 查询 数据 库 用 户 信息 ， 验 
证 用 户 登 录 。 用 户 登 录 成 功 后 服务 器 端 工作 线程 将 好 友信 息 发 送 给 客户 端 。 

。 广播 在 线 用 户 列 表 : 用 户 好 友 列 表 状 态 是 不 断 变 化 的 ， 服 务 器 端 会 定期 发 送 在 线 的 用 户 
列表 ， 以 便于 客户 端 刷 新 自己 的 好 友 列 表 。 

"接收 用 户 消息 : 用 户 在 聊天 时 发 送 消息 给 服务 器 端 ， 服 务 器 端 工 作 线程 一 直 不 断 地 接收 
用 户 消息 。 

。 转 发 消息 给 好 友 : 服务 器 端 工作 线程 接收 到 用 户 发 送 的 聊天 信息 ， 然 后 再 将 消息 转发 给 好 友 。 
采用 用 例 分 析 方 法 描述 服务 器 端 用 例 图 ， 如 图 24-2 所 示 。 


广播 在 线 用 户 列表 


服务 器 端 工作 线程 


图 24-2 QQ2006 项 目 服务 器 端 用 例 图 
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24.1.3 ”原型 设计 


服务 器 端 没 有 界面 ， 也 没有 原型 设计 ， 而 客户 端 有 界面 和 原型 设计 。 原 型 设计 主要 应 用 于 
图 形 界 面 应 用 程序 ， 原 型 设计 对 于 系统 设计 人 员 、 开 发 人 员 、 测 试 人 员 、UI 设计 人 员 以 及 用 
9 户 都 是 非常 重要 的 。QQ2006 项 目 客户 端 原型 设计 图 如 图 24-3 所 示 。 


机 2wf 一 一 一 一 加 


ee 办 阿 强 


"atax4 


0 


[mi 时 六 了 村 二 


| 与 晚 受 聊天 中 心 一 号 x 


与 亲 强 聊天 中 … ee 
7 2017-06-29 14:54:57 
/ 晚 爱 时 您 首 : 在 吗 
2017-06-29 14:54:59 
4 您 时 晚 爱 意 :在 的 
re 请 给 六 … = 


2017-06-29 14:54:59 
有 问 强 时 您 次 :在 的 


而 上 矶 路 了 本， 一 起 点 耻 而 1 一 
| 


图 24-3 QQ2006 项 目 客户 端 原型 设计 图 
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24.1.4 数据 库 设 计 


QQ2006 项 目 中 客户 端 没有 数据 库 ， 只 有 服务 器 端 有 数据 库 ， 服 务 器 数据 库 设计 如 图 24-4 | 
所 示 。 


friends 


User idl varchar(80) <pk, fkl> 
User id2 varchar(80) 《pk, fk2> 


Users 
user id varchar(80) <pk> 
User_pwd varchar(25) 

user name varchar(80) Ls. 
User_icon varchar(100) 


图 24-4 数据库 设 计 模 型 


现 对 数据 库 设计 模型 中 各 个 表 进 行 如 下 说 明 。 

1. 用户 表 

用 户 表 (users) 是 QQ2006 的 注册 用 户 ， 用 户 Id (Cuser id) 是 主键 ， 用 户 表 结构 如 表 24-1 
所 示 。 


表 24-1 用 户 表 


外 键 备注 
用 户 Id 
用 户 密码 
用 户 名 
用 户头 像 


2.， 用户 好 友 表 

用 户 好 友 表 (friends) 只 有 两 个 字段 用 户 Idl 和 用 户 It2， 它 们 是 用 户 好 友 的 联合 主键 ， 给 
定 一 个 用 户 Idl 和 用 户 Id2 可 以 确定 用 户 好 友 表 中 唯一 一 条 数据 ， 这 是 “主键 约束 ”。 用 户 好 
友 表 与 用 户 表 关系 比较 复杂 ， 用 户 好 友 表 的 两 个 字段 都 引用 到 用 户 表 用 户 Id 字段 ， 用 户 好 友 
表 中 的 用 户 Idl 和 用 户 Id2 都 是 必须 是 用 户 表 中 存在 的 用 户 Tt， 这 是 “外 键 约束 ”， 用 户 好 友 
表 结 构 如 表 24-2 所 示 。 


表 24-2 用 户 好 友 表 


字 段 名 数据 类 型 备 注 
ser dl varchar(80) | 用 户 Idl 
user id2 varchar(80) 用 户 Id2 


对 于 初学 者 理解 用 户 好 友 表 与 用 户 表 的 关系 有 一 定 的 困难 ， 下 面 通过 图 24-5 进一步 理解 
它们 之 间 的 关系 。 从 图 中 可 见 用 户 好 友 表 中 的 user_ idl 和 user id2 数据 都 是 用 户 表 user_id 存 
在 的 。 
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用 户 好 友 表 -~、 用 户 雪 
1 2 | 111 123 关东 和 28 


222 123 赵 1 30 
333 123 赵 2 52 
888 123 赵 3 53 


图 24-5 用 户 好 友 表 与 用 户 表 数据 


那么 用 户 111 的 好 友 应 该 有 222、333 和 888， 凡 是 好 友 表 中 user_id1 或 user_id2 等 于 111 
的 数据 都 是 其 好 友 。 要 想 通 过 一 条 SQL 语句 查询 出 用 户 111 的 好 友信 息 ， 可 以 有 多 种 写法 ， 
主要 使 用 表 连 接 或 子 查询 实现 ， 如 下 代码 是 笔者 通过 子 查询 实现 的 SQL 语句 。 

select user_id,user_pwd,user_namevuser_icon FROM users 


WHERE user id IN (select user id2 as user id from friends where user idl = 111) 


OR user id IN (select user idl as user id from friends where user id2 = 111) 


其 中 select user id2 as user id from friend where user idl = 111 和 select user idl as user id 
from friend where user id2 = 111 是 两 个 子 查询 ， 分 别 查询 出 好 友 表 中 user idl = 111 的 user_ 
id2 的 数据 和 user id2 = 111 的 user_id1 的 数据 。 

在 MySQL 数据 库 执行 SQL 语句 ， 结 果 如 图 24-6 所 示 。 


太志 二 符 -mysql -hiocalhost -uroot Pp 


图 24-6 子 查询 实现 SQL 语句 


24.1.5 网络 拓 扑 图 


QQ2006 项 目 分 为 客户 端 和 服务 器 端 ， 采 用 C/S 〈 客 户 端 / 服务 器 端 ) 网 络 结构 ， 如 图 24-7 
所 示 ， 服 务 器 端 只 有 一 个 ， 客 户 端 可 以 有 多 个 。 


人 客户 应 
用 P1 7 EE 


图 24-7 QQ2006 项 目 网 络 结构 
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24.1.6 ”系统 设计 


系统 设计 也 分 为 客户 端 和 服务 器 端 。 

1. 客户 端 系统 设计 阐 

如 图 24-8 所 示 是 客户 端 类 图 ， 客 户 端 有 三 个 窗口 : 用 户 登录 窗口 LoginFrame、 好 友 列 表 要 码 看 
窗口 FriendsFrame 和 聊天 窗口 ChatFrame， 其 中 CartFrame 与 FriendsFrame 有 关联 关系 。 


wx.Frame 


MyFrame 


LoginFrame ChatFrame FriendsFrame 


图 24-8 客户 端 类 图 


2. 服务 器 端 系统 设计 
服务 器 端 没 有 图 形 用 户 界 面 ， 服 务 器 端 主 程序 并 不 是 面向 对 象 的 ， 主 程序 没有 封装 成 为 
类 。 但 服务 器 端 访问 数据 库 的 数据 持久 层 是 面向 对 象 的 ， 类 图 如 图 24-9 所 示 。 


E findbyid(self, userid) 
findfriends(self, userid) 


图 24-9 服务 器 端 数 据 持久 层 类 图 


24.2 任务 1: 创建 服务 器 端 数 据 库 
在 设计 完成 后 ， 编 写 Python 代码 之 前 应 该 先 创建 服务 器 端 数据 库 。 


24.2.1 返 代 1.1: 安装 和 配置 MySQL 数据 库 


首先 应 该 为 开发 该 项 目 准备 好 数据 库 。 本 书 推荐 使 用 MySQL 数据 库 ， 如 果 没有 安装 Des: 
MySQL 数据 库 ， 可 以 参考 17.2 节 安 装 MySQL 数据 库 。 


24.2.2” 壕 代 1.2: 编写 数据 库 DDL 脚本 
按照 图 24-4 所 示 的 数据 库 设 计 模型 可 以 编写 出 数据 库 DDL 脚本 。 当 然 ， 也 可 以 通过 一 加 


看 视频 
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些 工具 生成 DDL 脚本 ， 然 后 把 这 个 脚本 导入 到 数据 库 中 执行 就 可 以 了 。 下 面 是 编写 的 DDL 
脚本 。 


/* 创建 数据 库 */ 
CREATE DATABASE IF NOT EXISTS qq’; 


use qq; 

:a 

CREATE TABLE IF NOT EXISTS users ( 
user_id varchar (80) not null, /* 用 户 Id */ 
user_ pwd varchar(25) not null, /* 用 户 密码 */ 
user_ name varchar (80) not null, /* 用 户 名 */ 
user_icon varchar (100) not null, 7* 用 户头 像 */ 


PRIMARY KEY (user id)); 


/* 用 户 好 友 表 Idl 和 Id2 互 为 好 友 */ 
CREATE TABLE IF NOT EXISTS friends ( 
user_idl varchar(80) not null, /* 用 户 Idl */ 
user_id2 varchar(80) not null, /* 用 户 Id2 */ 
PRIMARY KEY (user idl, user id2)); 


如 果 读 者 对 于 编写 DDL 脚本 不 熟悉 ， 可 以 直接 使 用 笔者 编写 好 的 qq-mysql-schema.sql 脚 
本 文件 ， 文 件 位 于 QQ2006 项 目下 的 db 目录 中 。 


24.2.3 友 代 1.3: 插 人 初始 数据 到 数据 库 


QQ2006 项 目 服务 器 端 有 一 些 初始 的 数据 ， 这 些 初 始 数据 在 创建 数据 库 之 后 插入 。 这 些 插 
园 入 数据 的 语句 如 下 : 


use qq 
/* 用 户 表 数 据 */ 

INSERT INTO users VALUES('111','123', ' 关 东升 '"，'28'); 
INSERT INTO users VALUES('222','123', ' 赵 1', '30'); 
INSERT INTO users VALUES('333','123', ' 赵 2', '52'); 


INSERT INTO users VALUES('888','123', ' 赵 3','53'); 


/* 用 户 好 友 表 Idl 和 Id2 互 为 好 友 */ 

INSERT INTO friends VALUES('111','222'); 
INSERT INTO friends VALUES('111',"'333'); 
INSERT INTO friends VALUES('888°',"111°'); 
INSERT INTO friends VALUES('222','333'); 


如 果 读者 不 愿意 自己 编写 插入 数据 的 脚本 文件 ， 可 以 直接 使 用 笔者 编写 好 的 qq-mysql- 
dataload.sql 脚本 文件 ， 文 件 位 于 QQ2006 项 目下 的 db 目录 中 。 
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24.3 任务 2: 初始 化 项 目 


本 项 目 推荐 使 用 PyCharm IDE 工具 ， 所 以 首先 参考 
3.2 节 创建 一 个 PyCharm 项 目 ， 项 目 名 称 定 为 QQ2006。 


24.3.1 和 帮 代 2.1: 添加 资源 图 片 


> Pimages 


名 
a > ll External Libraries 


图 24-10 QQ2006 项 目 resource 资源 目录 


项 目 中 会 用 到 很 多 资源 图 片 ， 为 了 使 用 方便 ， 这 些 图 
片 最 好 放 到 一 个 项 目 目录 下 。 参 考 图 24-10， 在 项 目 根 目 
录 下 创建 resource 文件 来， 然后 在 resource 文件 夹 下 再 
创建 icon 和 images 文件 夹 ， 项 目的 所 有 资源 文件 (声音 、 
图 片 和 配置 文件 等 ) 都 要 放 到 该 resource 目录 下 ， 这 就 
是 资源 目录 。images 文件 夹 是 项 目 所 需 的 资源 图 片 文 件 ， 
icon 文件 夹 是 项 目 所 需 的 图 标 文件 。 然 后 将 本 章 配套 资 
源 图 片 复制 到 项 目的 images 和 icon 文件 夹 中 。 


24.3.2” 壕 代 2.2: 添加 包 


参考 图 24-11 在 QQ2006 项 目 中 创建 如 下 两 个 包 。 
。com.zhijieketang.qq.client; 放置 客户 端 组 件 ; 
。com.zhijieketang.qq.server: 放置 服务 器 端 组 件 。 


HL Stucture 


24.4 任务 3: 编写 服务 器 端 数据 持久 层 


服务 器 端 主 程序 通过 数据 持久 层 访问 数据 库 ， 主 要 类 有 BaseDao 和 UserDao。 


24.4.1 ” 壕 代 3.1: 数据 库 配 置 文件 


为 了 配置 项 目 方便 ， 在 QQ2006 项 目 根 目录 下 创建 一 个 配置 文件 config.ini，config.ini 文 


件 内 容 如 下 : 
?数据库 设 置 
[db] 
host = 127.0.0.1 
port = 3306 
user = root 


password = 12345 
database = qq 
charset = utf8 


目前 config.ini 文件 主要 配置 的 是 数据 库 连接 。 
24.4.2” 碗 代 3.2: 编写 base_dao 模块 


base_dao 模块 中 定义 了 DAO 基 类 是 BaseDao 和 日 志 对 象 logger, base_dao 模块 代码 如 下 : 


# coding=utf-8 


v Bcom 
~ Di zhijieketang 
v maq 


v Dadient 
忆 _init_py 
~ Dsever 
贡 _init_py 
认 _init_py 
机 _init_py 
策 _ini_py 
v Pi resources 
> Bicon 
> Bimages 
> MN External Libraries 


图 24-11 QQ2006 项 目 包 


# 代码 文件 ， chapter24/Q882006/com/zhijieketang/qq/server/base_dao.py 


扫 码 看 视频 


扫 码 看 视频 
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wn 定义 Dao 基 类 "wm 
import pymysql 
import configparser 


import logging 
logger = logging.getLogger( name ) [0 


class BaseDao (object): 
def _ init (self): 
self.config = configparser.ConfigParser () 
self.config.read('config.ini', encoding="'utf-8') 


host = self.config['db'] ['host'] 

user = self.config['db'] ['user'] 

# 读 取 整 数 port 数据 

port = self.config.getint ('db', 'port') 
password = self.config['db'] ['password'] 
database = self.config['db'] ['database'] 
charset = self.config['db']['charset'] 


self.conn = pymysql.connect (host=host, 
user=user, 
port=port, 
password=password, 
database=database, 
charset=charset) 


def close (self) : 
www 关闭 数据 库 连 接 """ 


self.conn.close() 


在 DAO 基 类 BaseDao 中 代码 第 @ 行 定义 了 日 志 对 象 logger，logger 对 象 虽然 没有 在 基 类 
BaseDao 中 定义 ， 但 logger 对 象 与 BaseDao 都 是 在 base_dao 模块 中 定义 的 。 所 有 导入 base_ 
dao 模块 的 代码 都 可 以 使 用 logger 对 象 ， 这 样 就 不 用 在 每 一 个 模块 中 都 定义 logger。 

基 类 BaseDao 的 其 他 代码 与 24.4.2 节 BaseDao 类 似 ， 这 里 不 再 效 述 。 


24.4.3 帮 代 3.3: 编写 用 户 管理 DAO 类 
用 户 管理 UserDAO 类 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/Q82006/com/zhijieketang/qq/server/user_dao.py 


""" 用 户 管理 DAO""" 


from com.zhijieketang.qq.server.base dao import BaseDao 


class UserDao (BaseDao): 
def _ init (self): 


super()._init _() 
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def findbyid(self, userid): @ 
""" 根据 用 户 id 查询 用 户 信息 """ 


try: 
# 2。 创建 游标 对 象 
with self.conn.cursor() as cursor: 
# 3。 执行 SQL 操作 
3ql = "select user id,user pwd,user name, user icon ' \ 
"from users where user id =$%s"' 
cursor.execute (sql, userid) 
# 4。. 提取 结果 集 


row = cursor.fetchone() 


if row is not None: 


user = {} 

user['user id'] = row[0] 
user['user pwd'] = row[1] 
user['user name'] = row[2] 
user['user icon'] = row[3] 


return user 
# with 代码 块 结束 5， 关 闭 游标 


finally: 
# 6。 关 闭 数据 连接 


self.close() 


def findfriends (self, userid): 回 
""" 根据 用 户 id 查询 好 友信 息 """ 


所 
加 
四 
my 
四 

0 


[] 


创建 游标 对 象 
with self.conn.cursor() as cursor: 
# 3。 执行 SQL 操作 


3ql = 'select user id,user pwd,user name,user icon FROM users WHERE ' \ 


和 
ID 


' user id IN (select user id2 as user id from friends ' \ 
”where user idl = %s3) OR user id IN (select user idl as user id ' \ 


' from friends where user id2 = ss) @ 


cursor.execute (sql, (userid, userid)) 


# 4. 提取 结果 集 


result set = cursor.fetchall() 


for row in result set: 
user = {} 
user['user id'] = row[0] 


user["'user pwd'] = row[1] 
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user['user name'] = row[2] 


user['user icon'] = row[3] 


users.append (user) 
# with 代码 块 结束 5. 关闭 游标 
finally: 
# 6。 关闭 数据 连接 


self.close() 


return users 


代码 第 四 行 findbyid(self, userid) 方法 是 定义 按照 主键 查询 。 代 码 第 @@ 行 findfriends(self, 
userid) 方法 是 定义 按照 用 户 Id 查找 其 好 友 数 据 。 代 码 第 @ 行 SQL 语句 使 用 了 子 查询 。 
24.5 任务 4: 客户 端 UI 实现 

从 客观 上 讲 ， 客 户 端 UI 实现 开发 的 工作 量 是 很 大 的 ， 有 很 多 细节 工作 需要 完成 。 


24.5.1 壕 代 4.1: 编写 my_frame 模块 
my_frame 模块 中 定义 了 自 定义 窗口 类 MyFrame 和 一 些 模块 变量 。my_frame 模块 中 代码 


# coding=utf-8 
# 代码 文件 : chapter24/8Q2006/com/zhijieketang/qq/client/my_frame.py 


""" 定义 Frame 窗口 基 类 """ 
import logging 

import socket 

import sys 


import wx 
logger = logging.getLogger(_name_ ) @ 


# 服务 器 端 IP 

SERVER_IP = "127.0.0.1， 
# 服务 器 端口 号 
SERVER_PORT = 8888 


# 服务 器 地 址 


server address = (SERVER IP, SERVER_PORT) 


# 操作 命令 代码 

COMMAND LOGIN = 1 # 登录 命令 © 
COMMAND LOGOUT = 2 # 下 线 命令 

COMMAND SENDMSG = 3 # 发 消息 命令 

COMMAND REFRESH = 4 # 刷新 好 友 列表 命令 


client socket = socket.socket (socket.AF INET, socket.SOCK DGRAM) 
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# 设置 超时 1 秒 ， 不 再 等 待 接收 数据 


client socket.settimeout (1) 回 


class MyFrame (wx.Frame): 


def _init (self, title, size): 
super()._init (parent-=None, title-title, size-size, 
Style=wx.DEFAULT FRAME STYLE ^ wx.MAXIMIZE BOX) 
# 设置 窗口 居中 
self.Centre() 
# 设置 Frame 窗口 内 容 面 板 


self.contentpanel = wx.Panel (parent=self) 


ico = Wx.Icon('resources/icon/qq.ico', wx.BITMAP TYPE ICO) 
# 设置 窗口 图 标 

self.SetIcon (ico) 

# 设置 窗口 的 最 大 和 最 小 尺寸 

self.SetSizeHints (size, size) 

self.Bind (wx.EVT CLOSE, self.OnClose) 


def OnClose (self, event): 
# 退出 系统 
self.Destroy() 
client socket.close() 
sys.exit (0) 


上 述 代 码 第 @ 行 ~ 第 @ 行 是 在 my_frame 模块 中 定义 的 变量 ， 这 些 变量 在 所 有 导入 my_ 
frame 模块 的 代码 中 都 可 以 使 用 。 代 码 第 @ 行 和 第 @ 行 为 定义 操作 命令 代码 。 代 码 第 @ 行 窗口 
创建 了 基于 UDP Socket 的 对 象 。 代 码 第 @ 行 设置 了 Socket 超时 时 间 。 

基 类 MyFrame 其 他 代码 与 24.2 节 MyFrame 类 似 ， 这 里 不 再 歼 述 。 


24.5.2” 壕 代 4.2: 登录 窗口 实现 


客户 端 启动 后 应 马上 显示 用 户 登 录 窗口 ， 界 面 如 图 24-12 所 示 。 界 面 中 有 很 多 组 件 ， 但 是 加 
本 例 中 主要 使 用 文本 框 、 密 码 框 和 两 个 按钮 。 用 户 输入 QQ 号 码 和 QQ 密码 ， 单 击 “登录 " 按 中 
钮 ， 如 果 输 入 的 账号 和 密码 正确 ， 则 登录 成 功 并 进入 好 友 列表 窗口 ， 如 果 输 入 的 不 正确 ， 则 弹 加 二 和 
出 如 图 24-13 所 示 的 对 话 框 。 


Mgmb6 
多 和 


Beta3 


图 24-12 登录 窗口 


402 所 | Python 从 小 白 到 大 牛 


用 户 登录 窗口 LoginFrame 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/Q82006/com/zhijieketang/qq/ | [| 
client/login frame.py ! 


24-13 ”登录 失败 提示 
""" 用 户 登录 窗口 """ 


import json 


from com.zhijieketang.qq.client.friends frame import FriendsFrame 
from com.zhijieketang.qq.client.my frame import * 


class LoginFrame (MyFrame): 
def _init_ (self): 
super()._init (title='QQ 登录 '，size=(340，255)) 


# 创建 项 部 图 片 
topimage = wx.Bitmap('resources/images/QQ11.JPG', wx.BITMAP_ TYPE_ JPEG) 
topimage_ sb = wx.StaticBitmap(self.contentpanel, bitmap=topimage) 


# 创建 界面 控件 


middlepanel = wx.Panel (self.contentpanel, style=wx.BORDER DOUBLE) 


accountid st = wx.StaticText (middlepanel, label='QQ 号 码 } ') 
password st = wx.StaticText (middlepanel, label='QQ 密码 ') 
self.accountid txt = WX.TextCtrl (middlepanel) 

self.password txt = wx.TextCtrl (middlepanel, style=wx.TE_ PASSWORD) 


st = wx.StaticText (middlepanel，1label=' 忘记 密码 ? ') 
st.SetForegroundColour (wx .BLUE) 


# 创建 FlexGrid 布局 fgs 对 象 
fgs = wx.FlexGridSizer(3, 3, 8, 15) 
fgs.AddMany ([ (accountid st, 1, Wwx.ALIGN CENTER VERTICAL | wx.ALIGN RIGHT 
| wx.FIXED MINSIZE), 
(self.accountid txt, 1, wx.CENTER | wx.EXPAND), 
wx.StaticText (middlepanel), 
(password st, 1, wx.ALIGN CENTER VERTICAL | wx.ALIGN RIGHT 
| wx.FIXED MINSIZE), 
(self.password txt, 1, Wwx.CENTER | wx.EXPAND), 
(st, 1, wx.ALIGN CENTER VERTICAL | wx.ALIGN RIGHT | 
Wx. FIXED MINSIZE), 
wx.StaticText (middlepanel), 
(wx.CheckBox (middlepane1，-1， ' 自动 登录 ') ，1， wx.CENTER | 
Wx. EXPAND), 
(wx.CheckBox (middlepane1，-1， ' 隐身 登录 ') ，1，wx.CENTER | 
wx.EXPAND) ] ) 


# 设置 FlexGrid 布局 对 象 
fgs.AddGrowableRow (0, 1) 
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fgs.AddGrowableRow (1, 1) 
fgs.AddGrowableCol1 (0, 1) 
fgs.AddGrowableCol (1, 1) 
fgs.AddGrowableCol1 (2, 1) 


panelbox = wx.BoxSizer() 
panelbox.Add (fgs, -1, wx.CENTER | Wwx.ALL | wx.EXPAND, border=10) 
middlepanel .SetSizer (panelbox) 


# 创建 按钮 对 象 

okb_btn = wx.Button (parent=self.contentpane1l，1label=' 登录 ') 
self.Bind (wx.EVT BUTTON, self.okb btn onclick, okb btn) 
cancel btn = wx.Button(parent=self.contentpanel，label=' 取消 ') 
self.Bind (wx.EVT BUTTON, self.cancel btn onclick, cancel btn) 


# 创建 水 平 Box 布局 hbox 对 象 

hbox = wx.BoxSizer (wx.HORIZONTAL) 

hbox.Add (wx.Button (parent=self.contentpanel,，label=' 申请 号 码 | ')， 
1, WX.CENTER | Wwx.ALL | wx.EXPAND, border=10) 

hbox.Add (okb btn, 1, wx.CENTER | wx.RLL | wx.EXPAND, border=10) 

hbox.Add (cancel btn, 1, Wwx.CENTER | Wwx.ALL | wx.EXPAND, border=10) 


Vbox = wx.BoxSizer (wx.VERTICAL) 

vbox.Add (topimage_sb, -1, Wx.CENTER | wx.EXPAND) 

vbox.Add (middlepanel, -1, wx.CENTER | wx.ALL | wx.EXPAND, border=5) 
vbhox.Add (hbox, -1, Wwx.CENTER | wx.BOTTOM, border=1) 


self.contentpanel.SetSizer (vbox) 


def okb btn onclick(self, event): O 
""" 确定 按钮 事件 处 理 """ 


account = self.accountid txt.GetValue() 
password = self.password txt.GetValue() 
user = self.login(account, password) [(@) 


if user is not None: 
logger.info(' 登录 成 功 。') 
next_ frame = FriendsFrame (user) 
next_frame.Show() 
self.Hide() 
else: 
logger .info("' 登录 失败 。') 
dlg = wx.MessageDialog (self,' 您 QQ 号 码 或 密码 不 正确 '， 
" 登录 失败 '， 
WxX.OK | wx.ICON ERROR) 
dlg.ShowModal () 
dlg.Destroy() 


def cancel btn onclick(self, event): 


”"" 取消 按钮 事件 处 理 """ 
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# 退出 系统 
self.Destroy() 
sys.exit (0) 


def login(self, userid, password): 


""" 客户 端 向 服务 器 端 发 送 登 录 请 求 """ 


# TODO 登录 处 理 


上 述 代 码 第 Q@ 行 定义 的 okb_btn_onclick(self, event) 方法 是 用 户 单 击 登 录 按 钮 时 调用 的 。 
其 中 代码 第 @ 行 调用 了 self.login(account, password) 方法 进行 登录 处 理 ， 如 果 登 录 成 功 则 返回 
当前 用 户 信息 ， 如 果 返 回 的 为 None 则 表示 登录 失败 。 


24.5.3 ”迭代 4.3: 好 友 列 表 窗 口 实现 


在 客户 端 用 户 登录 成 功 之 后 ， 界 面 会 跳 转 到 好 友 列 表 窗 口 ， 如 图 
24-14 所 示 。 [5 
好 友 列 表 窗 口 类 FriendsFrame 代码 如 下 : 和 


要 码 看 视频 


# coding=utf-8 因 
# 代码 文件 ， chapter24/QQ2006/com/zhijieketang/qq/client/friends_ 图 
frame.py 


"…"" 好 友 列表 窗口 """ 


import json 
import threading 


import wx.lib.scrolledpanel as scrolled 


from com.zhijieketang.qq.client.chat frame import ChatFrame 


from com.zhijieketang.qq.client.my frame import * 


图 24-14 好友 列 表 窗口 


class FriendsFrame (MyFrame): 
def _init (self, user): 
super()._init (title=' 我 的 好 友 '，size=(260，600)) 


self.chatFrame = None 


# 用 户 信息 

self.user = user 

# 好 友 列表 

self.friends = user['friends'] 

# 保存 好 友 控件 的 列表 

self.friendctrols = [] OO 
usericonfile = 'resources/images/{0}.jpg'.format (user['user icon']) 


usericon = wx.Bitmap (usericonfile, wx.BITMAP TYPE JPEG) 
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# 顶部 面板 

toppanel = wx.Panel (self.contentpanel) 

usericon sbitmap = wx.StaticBitmap (toppanel, bitmap=usericon) 
username st = Wwx.StaticText (toppanel, style=wx.ALIGN CENTRE HORIZONTAL, 


label=user['user name']) 


# 创建 项 部 box 布局 管理 对 象 

topbox = Wwx.BoxSizer (wx.VERTICAL) 
topbox.AddSpacer (15) 

topbox.Add (usericon sbitmap, 1, wx.CENTER) 
topbox.RAddSpacer (5) 

topbox.Add (username st, 1, wx.CENTER) 
toppanel.SetSizer (topbox) 


# 好 友 列 表面 板 
panel = scrolled.ScrolledPanel (self.contentpanel, -1, size=(260, 1000), 
style=wx.DOUBLE BORDER) 


gridsizer = wx.GridSizer(cols=1, rows=20, gap=(1, 1)) 


if lenl(self.friends) > 20: 
gridsizer = wx.GridSizer (cols=1, rows=len(self.friends), gap=(1, 1)) 


# 添加 好 友 到 好 友 列 表面 板 


for index, friend in enumerate (self.friends): @ 
friendpanel = wx.Panel (panel, id=index) 


fdname_ st = wx.StaticText (friendpanel, id=index, style=wx.ALIGN_ 
CENTRE_HORIZONTAL, label=friend['user name']) 


fdqq_st = wx.StaticText (friendpanel, id=index, style=wx.ALIGN_ 
CENTRE_HORIZONTAL, label=friend['user id']) 


path 


icon 


'resources/images/{0}.jpg' .format (friend['user icon']) 
wx.Bitmap (path, wx.BITMAP TYPE JPEG) 


# 如 果 好 友 在 线 fdqqname_st 可 用 ， 否 则 不 可 用 


if friend['online'] == '0': @ 
# 转换 为 灰色 图 标 
icon2 = icon.ConvertToDisabled() @ 


fdicon sb = wx.StaticBitmap (friendpanel, id=index, bitmap=icon2, 
style=wx.BORDER RAISED) 


fdicon_sb.Enable (False) © 

fdname_st.Enable (False) 

fdqq_st.Enable (False) @ 

self.friendctrols.append( (fdname st, fdqq st, fdicon sb, icon)) 
else: 

fdicon sb = wx.StaticBitmap (friendpanel, id=index, bitmap=icon, 


style=wx.BORDER RAISED) 
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def 


fdicon sb.Enable (True) 
fdname_st.Enable (True) 

fdqq_st.Enable (True) 

self.friendctrols.append ( (fdname st, fdqq st, fdicon sb, icon)) 


# 为 好 友 图 标 、 昵 称 和 QQ 控件 添加 双击 事件 处 理 

fdicon sb.Bind (wx.EVT LEFT DCLICK, self.on dclick) 
fdname st.Bind (wx.EVT LEFT DCLICK, self.on dclick) 
fdqq_st.Bind (wx.EVT LEFT DCLICK, self.on dclick) 


friendbox = wx.BoxSizer (wx.HORIZONTAL) 
friendbox.Add (fdicon sb, 1, wx.CENTER) 
friendbox.Add (fdname st, 1, wx.CENTER) 
friendbox.Add (fdqq_st, 1, wx.CENTER) 


friendpanel .SetSizer (friendbox) 
gridsizer.Add (friendpanel, 1, wx.ALL, border=5) 


panel.SetSizer (gridsizer) 


# 创建 整体 box 布局 管理 器 

box = wx.BoxSizer (wx.VERTICAL) 

box.Add (toppanel, -1, Wwx.CENTER | wx.EXPAND) 
box.Add (panel, -1, wx.CENTER | wx.EXPAND) 
self.contentpanel.SetSizer (box) 


on dclick(self, event): 
# 获得 选中 friends 的 好 友 索 引 
fid = event.GetId() 


if self.chatFrame is not None and self.chatFrame.IsShown(): 
dlg = wx.MessageDialog(self，' 聊天 窗口 已 经 打开 。 ' ， 
" 操作 失败 '， 
WX.OK | Wwx.ICON_ ERROR) 
dlg.ShowModal () 
dlg.Destroy () 
return 


# 停止 当前 线程 
self.isrunning = False 
self.tl.join() 


self.chatFrame = ChatFrame(self，self.user，self.friends[fid]) 
self.chatFrame.Show() 


event .Skip () 


# TODO 启动 接收 消息 子 线程 
# TODO 刷新 好 友 列 表 
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上 述 代码 第 @ 行 定义 了 成 员 列表 变量 friendctrols， 它 用 来 保存 好 友 图 标 等 控件 。 代 码 第 @ 
行 遍历 所 有 好 友 列 表 ， 其 中 index 是 循环 变量 ，friend 是 取出 的 好 友 。 代 码 第 @ 行 是 判断 好 友 
是 否 在 线 ， 其 中 friend['online'] 一 '0' 好 友 下 线 ，friend['online'] 一 '1' 好 友 在 线 。 在 好 友 不 在 
线 时 ， 需 要 将 好 友 的 图 标 〈fdicon_sb)、QQ 静态 文本 (fdqq_st) 和 名 字 静 态 文 本 (fdname_st) 
等 控件 设置 为 不 可 用 ， 见 代码 第 @ 行 、 第 @ 行 和 第 @ 行 。 

提示 : wx.StaticBitmap 控件 即便 设置 为 不 可 用 ， 它 显示 的 图 标 或 图 片 仍然 是 高 亮 的 ， 要 
达到 灰色 的 效果 ， 需 要 对 原始 图 片 进 行 处 理 ， 使 其 转换 为 灰色 图 片 ， 代 码 第 转行 wx.Bitmap 的 
ConvertToDisabled() 方法 可 以 将 图 片 转换 为 灰色 图 片 。 


代码 第 @ 行 和 第 @ 行 是 将 好 友 的 图 标 等 控件 保存 到 一 个 元 组 中 ， 再 将 该 元 组 保存 到 
friendctrols 列表 中 ， 其 中 元 组 有 4 个 元 素 ， 即 (fdname st, fdqq_st, fdicon_sb, icon)。 

另外 ， 有 关 用 户 下 线 、 启 动 接收 消息 子 线程 和 刷新 好 友 列 表 ， 这 些 处 理会 在 后 面 详细 介绍 。 

24.5.4 友 代 4.4: 聊天 窗口 实现 

在 客户 端 用 户 双 击 好 友 列 表 中 的 好 友 ， 会 弹出 好 友 聊 天 窗口 ， 界 面 如 图 24-15 (a) 所 示 ， 回 吧 
在 这 里 可 以 给 好 友 发 送 聊天 信息 ， 可 以 接收 好 友 回复 的 信息 ， 如 图 24-15 (b) 所 示 。 


Er rr 二 


#2018-03-21 12:49:42# 
: 你 好 ! 


对 您 说 : 
#2018-03-21 12:49:49# 
关东 升 说 : 你 好 ! 


bs :你 好 ! 
#2018-03-21 12:49:56# 
关东 升 对 你 说 : 吃 了 四 7? 


| | 旺 =" 
(a) (b) 
图 24-15 ”聊天 窗口 


聊天 窗口 类 ChatFrame 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/Q82006/com/zhijieketang/qq/client/chat_frame.py 


mun 好 友 聊 天 窗口 www 
import datetime 

import json 

import threading 

from com.zhijieketang.qq.client.my frame import * 


class ChatFrame (MyFrame): 


def _init (self, friendsframe, user, friend): 
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super()._init (title='', size=(450, 400)) 


self.friendsframe friendsframe 


self.user = user 


self.friend = friend 


title = '{0} 与 {1} 聊天 中 ...'.format (user['user name'], friend['user name']) 
self.SetTitle (title) 


# 创建 查看 消息 文本 输入 控件 
self.seemsg tc = wx.TextCtrl (self.contentpanel, style=wx.TE MULTILINE | 


Wx.TE_ READONLY) 


def 


self.seemsg_ tc.SetFont (wx.Font (11, wx.FONTFAMILY DEFAULT, 
Wx.FONTSTYLE NORMAL, 
Wx.FONTWEIGHT_NORMAL，faceName=' 微软 雅 黑 ') ) 


# 底部 发 送 消息 面板 
bottompanel = wx.Panel (self.contentpanel, style=wx.DOUBLE BORDER) 


bottomhbox = wx.BoxSizer() 

# 创建 发 送 消息 文本 输入 控件 

self.sendmsg tc = WX.TextCtrl (bottompanel) 

# 为 发 送 消息 文本 输入 控件 设置 焦点 

self.sendmsg_ tc.SetFocus () 

self.sendmsg tc.SetFont (wx.Font (11, wx.FONTFAMILY DEFAULT, 
WX.FONTSTYLE NORMAL, 
Wx.FONTWEIGHT_NORMAL，faceName=' 微软 雅 黑 ') ) 


sendmsg_btn = wx.Button (bottompanel，1label=' 发 送 ') 
self.Bind (wx.EVT_ BUTTON, self.on click, sendmsg_btn) 


bottomhbox.Add (self.sendmsg tc, 5, Wx.CENTER | Wx.ALL | Wx.EXPAND, border=5) 
bottomhbox.Add (sendmsg_ btn, 1, wx.CENTER | Wwx.ALL | Wwx.EXPAND, border=5) 
bottompanel .SetSizer (bottomhbox) 


# 创建 整体 Box 布局 管理 对 象 

box = wx.BoxSizer (wx.VERTICAL) 

box.Add (self.seemsg tc, 5, WX.CENTER | wx.ALL | Wx.EXPAND, border=5) 
box.Add (bottompanel, 1, wx.CENTER | wx.ALL | wx.EXPAND, border=5) 
self.contentpanel.SetSizer (box) 


# 消息 日 志 
self.msglog = 


on_click(self, event): 
# 发 送 消息 
# TODO 发 送 消息 


# TODO 接收 消息 
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# 重 写 onclose 方法 


def OnClose (self, event): @ 
# 停止 当前 子 线程 
self.isrunning = False 


self.t1.join() 
self.Hide() 
# 重启 好 友 列 表 窗 口子 线程 


self.friendsframe.resettread() 


用 户 关闭 聊天 窗口 时 并 不 退出 系统 ， 见 代码 第 @ 行 ， 此 操作 只 是 停止 当前 窗口 中 的 线程 ， 
隐藏 当前 窗口 ， 回 到 好 友 列 表 界 面 ， 并 重启 好 友 列 表 线 程 。 


提示 : 当前 窗口 中 启动 的 线程 ， 在 窗口 退出 、 隐 藏 时 是 一 定 停止 状态 。 


24.6 任务 5: 用 户 登录 过 程 实现 


用 户 登录 时 客户 端 和 服务 器 端 互 相交 互 ， 客 户 端 和 服务 器 端 代码 比较 复杂 ， 涉 及 多 线程 纺 
程 。 用 户 登录 过 程 如 图 24-16 所 示 ， 当 用 户 1 打开 登录 对 话 框 ， 输 入 QQ 号 码 和 QQ 密码 ， 单 
击 登录 按钮 ， 用 户 登 录 过 程 开 始 。 

第 中 步 : 用 户 1 登录 ， 客 户 端 将 QQ 号 码 和 QQ 密码 数据 封装 发 给 服务 器 端 。 

第 @@ 步 ， 服务 器 端 接收 用 户 1 请 求 ， 验 证 用 户 1 的 QQ 号 码 和 QQ 密码 是 否 与 数据 库 的 
QQ 号 码 和 QQ 密码 一 致 。 

第 @ 步 : 返回 给 用 户 1 登录 结果 。 服 务 器 端 将 登录 结果 发 给 客户 端 ， 客 户 端 接收 服务 器 端 
返回 的 消息 ， 登 录 成 功 进入 用 户 好 友 列 表 ， 不 成 功 则 给 用 户 提示 信息 。 


客户 端 在 户 央 


hp 人 > ~ 外 


图 24-16 用户 登录 过 程 


24.6.1 ” 壕 代 5.1: 客户 端 启动 
在 介绍 客户 端 登录 编程 之 前 ， 首 先 介绍 客户 端 启动 模块 qq_client， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/QQ2006/qq_client.py 


| 除 409 


扫 码 看 视频 


410 者 | Python 从 小 白 到 大 牛 


import logging 
import wx 
from com.zhijieketang.qq.client.login frame import LoginFrame 
logging.basicConfig (level=logging.INFO, 
format='%(asctime)s - %(threadName)s —' 
"gs (name)s - S$(funcName)s - $(levelname)s - %(message)s') @ 
logger = logging.getLogger(_name_) @ 


class App (wx.App): @ 


def OnInit (self): 
# 创建 窗口 对 象 


frame = LoginFrame() @ 
frame.Show() © 
return True 
if _ name == '_ main_': 
app = App() 
app.MainLoop () # 进入 主事 件 循环 


在 qq_client 模块 中 定义 了 一 个 模块 变量 logger， 见 代码 第 @ 行 ， 它 是 日 志 对 象 。 代 码 第 
@ 行 是 设置 日 志 输出 格式 。qq_client 模块 中 还 定义 了 一 个 wx.Python 的 App 应 用 程序 类 ， 见 
代码 第 @ 行 。 代 码 第 @ 行 是 创建 登录 窗口 ,代码 第 @ 行 是 显示 登录 窗口 。 代 码 第 @ 行 创建 了 
App 对 象 ， 然 后 调用 app.MainLoop() 进入 主事 件 循环 。 


24.6.2” 近 代 5.2: 客户 端 登录 编程 


客户 端 登录 程序 需要 在 LoginFrame 中 编写 ， 主 要 完成 图 24-16 所 示 第 四 步 和 第 回 步 。 
LoginFrame 代码 如 下 : 


加 
扫 码 看 视频 # coding=utf-8 
# 代码 文件 : chapter24/QQ82006/com/zhijieketang/qq/client/login frame.py 


class LoginFrame (MyFrame): 
def _init (self): 
super () ._init (title='QQ 登录 '，size=(340，255)) 


def login(self, userid, password): [oy 
""" 客户 端 向 服务 器 端 发 送 登 录 请 求 """ 


json obj = {} 加 
json_obj['command'] = COMMAND LOGIN 
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json_obj ['user_id'] = userid 
json obj['user pwd'] = password @ 
# JSON 编码 

json_str = json.dumps (json_obj) 


# 给 服务 器 端 发 送 数据 


client socket.sendto(json str.encode(), server address) 


# 从 服务 器 端 接收 数据 

json data, _ = client socket.recvfrom(1024) 
# JSON 解码 

json obj = json.loads (json_data.decode ()) 


logger.info(' 从 服务 器 端 接收 数据 : {0}' .format (json_obj)) 


if json obj['result'] == '0°': 
# 登录 成 功 


return json obj 


上 述 代码 第 @@ 行 定义 了 login(self, userid, password) 方法 ， 当 用 户 单 击 登录 按钮 时 调用 。 


代码 第 @ 行 和 第 @ 行 是 准备 发 送 给 服务 器 端的 参数 ， 参 数 是 JSON 格式 ，JSON 数据 内 容 如 下 : 


{ 


Sor Ld" ELL, # QQ 号 码 
"user_pwd": "123", #QQ 密码 
"command": 1 # 命令 1 为 登录 


1 
代码 第 图 行 是 将 JSON 对 象 编码 为 JSON 字符 串 。 代 码 第 @ 行 是 发 送 数 据 给 指定 服务 器 


端 。 到 此 为 止 ， 用 户 发 送 登录 请 求 给 服务 器 端 ， 完 了 图 24-16 中 所 示 的 第 四 步 操作 。 


代码 第 @ 行 客户 端 调用 Socket 对 象 的 recvfrom() 方法 等 待 服务 器 端 应 答 。 服 务 器 端 返回 


数据 json_data，json_data 是 JSON 字符 串 ， 代 码 第 @ 行 将 JSON 字符 串 解码 为 JSON 对 象 。 如 
果 从 服务 器 端 返回 到 result 的 数据 为 '0' 则 说 明 登 录 成 功 ， 否 则 登录 失败 。 


从 服务 器 端 返回 的 JSON 数据 示例 如 下 : 


{ 
westilt mw" # 登录 结果 ，"0" 登录 成 功 ，"-1" 登录 失败 
"52", 
"user_ pwd": "123", 
"nner ds "333" 


"user_icon" 


"user_name": " 赵 2"， 
"friends": [ # 该 用 户 的 好 友 列 表 
{ 
“on 三 # 好友 在 线 状态 ，"1" 为 在 线 ，"0" 为 离线 


"user icon": "28", 
"user_ pwd": "123", 
"user id": "111", 


miser naiaess “关东 升 “ 


"online™”s “7 
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"Ser ic0n"s "30"; 


"user pwd": "123", 


"user id": 
"user name":“" 赵 1" 

} 

{ 
"online": "0", 
"user_ icon": "53", 


"user_pwd": "123", 
"user id": "888", 


"user name": " 赵 3" 


} 


到 此 为 止 完成 了 图 24-16 中 所 示 的 第 @ 步 操作 。 如 果 用 户 登录 成 功 则 login() 方法 会 返回 
非 空 数据 ， 登 录 失 败 login() 方法 返回 None。 

上 述 代 码 第 @ 行 用 来 判断 login() 返回 值 是 否 为 None， 如 果 为 非 None 则 登录 成 功 ， 显 示 
FriendsFrame 窗口 。 


24.6.3 友 代 $.3: 服务 器 端 启动 
在 介绍 服务 器 端 编程 之 前 ， 首 先 介绍 服务 器 端 启 动 模块 qq_server， 代 码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/QQ2006/qq_server.py 


# 服务 器 端 IP 

SERVER_IP = '127.0.0.1' 
# 服务 器 端口 号 
SERVER_PORT = 8888 


# 操作 命令 代码 

COMMRND_LOGIN = 1 # 登录 命令 
COMMAND LOGOUT = 2 # 下 线 命令 
COMMRND_SENDMSG = 3 # 发 消息 命令 
COMMAND REFRESH = 4 # 刷新 好 友 列 表 命令 


# 所 有 已 经 登录 的 客户 端 信息 


clientlist = [] 


server_ socket = socket.socket (socket.AF INET, socket.SOCK DGRAM) 
server_ socket .bind( (SERVER IP, SERVER PORT)) 


logger.info(' 服务 器 端 启动 ， 监听 自己 的 端口 10} . . . ' . format (SERVER_PORT) ) 


# 创建 字 节 序列 对 象 列表 ， 作 为 接收 数据 的 缓冲 区 
buffer = [] 


第 24 章 项 目 实战 4: 开发 Python 版 QQ2006 聊天 工具 | 萝 413 


# 主 循环 

while True: @ 
#TODO 服务 器 端 处 理 

上 述 代 码 第 @ 行 是 服务 器 端 循环 ， 服 务 器 端 一 直 循环 接收 客户 端 数据 并 发 送 数 据 给 客户 端 。 


24.6.4” 壕 代 5.4: 服务 器 端 验证 编程 
迁 代 5.4 任务 实现 图 24-16 中 所 示 的 第 @ 步 操作 。 服 务 器 端 实现 代码 如 下 ; 


# 主 循环 


while True: 
try: 
# 接收 数据 包 
data, client address = server socket.recvfrom(1024) [Oy 


json_obj = json.loads (data.decode () ) 


logger.info(' 服务 器 端 接收 客户 端 ， 消 息 : {0}' .format (json_obj)) 


# 取出 客户 端 传递 过 来 的 操作 命令 


command = json_obj['command'] 


if command == COMMAND LOGIN: # 用 户 登录 过 程 
# 通过 用 户 Id 查询 用 户 信息 
userid = json obj['user id'] 
userpwd = json obj['user_ pwd'] 
logger.debug('user id:{0} user pwd:{1}'.format (userid, userpwd)) 


dao = UserDao() 
user = dao.findbyid (userid) 
logger.info (user) 


# 判断 客户 端 发 送 过 来 的 密码 与 数据 库 的 密码 是 否 一 致 
if user is not None and user['user pwd'] == userpwd: ## 登录 成 功 @ 
# 登录 成 功 
# 创建 保存 用 户 登录 信息 的 二 元 组 
clientinfo = (userid, client address) 
# 用 户 登录 信息 添加 到 client1ist 
clientlist.append(clientinfo) © 


json obj = user 


json obj['result'] = "0" 


# 取出 好 友 用 户 列表 


dao = UserDao() 
friends = dao.findfriends (userid) 
# 返回 clientinfo 中 userid 列表 

cinfo_userids = map(lambda it: it[0], clientlist) @ 
for friend in friends: 


fid = friend['user id'] 
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# 添加 好 友 状 态 ， "1 " 在 线 ，'0' 离线 
friend['online'] = '0" 
if fid in cinfo userids: # 用 户 登录 


friend['online'] = '1" 


json obj['friends'] = friends 
logger.info(' 服务 器 端 发 送 用 户 成 功 ， 消 息 : {0}' .format (json_obj)) 


# JSON 编码 

json_str = json.dumps (json_obj) 

# 给 客户 端 发 送 数据 

Server_ socket.sendto(json_ str.encode(), client address) @ 
else: ## 登录 失败 

json_obj = {} 


json obj['result'] = '-1" 

# JSON 编码 

json_str = json.dumps (json obj) 
# 给 客户 端 发 送 数据 


Server_socket.sendto(json_str.encode(), client address) ! 
elif command == COMMAND SENDMSG: # 用 户 发 送 消息 
# TODO 用 户 发 送 消息 


elif command == COMMAND LOGOUT: # 用 户 发 送 下 线 命令 
# TODO 用 户 发 送 消息 


# TODO 刷新 用 户 列表 


except Exception: 
tb.print exc() 
logger.info('timed out') 


上 述 代码 第 @ 行 是 从 客户 端 传递 过 来 消息 。 代 码 第 @ 行 从 消息 中 取出 命令 。 代 码 第 @ 行 判 
断 操作 命令 是 否 为 用 户 登 录 命 令 (COMMAND_LOGIN)。 

代码 第 @ 行 判断 客户 端 传递 过 来 的 密码 与 数据 库 查询 出 来 的 密码 是 否 一 致 ， 如 果 密 码 一 
致 登录 成 功 。 登 录 成 功 后 需要 将 登录 用 户 信息 添加 到 clientlist 对 象 ， 见 代码 第 @ 行 。clientlist 
包 保 存 了 所 有 登录 的 用 户 信息 的 列表 ，clientlist 中 的 每 一 个 元 素 都 是 二 元 组 ， 例 如 (userid， 
client_address)， 其 中 userid 是 用 户 It，client_address 是 登录 用 户 的 主机 地 址 和 端口 ， 以 备 后 
面 的 服务 器 端 与 客户 端的 通信 。 

代码 第 @ 行 是 根据 用 户 Id 查询 其 好 友 列 表 。 代 码 第 @ 行 是 找 出 这 些 好 友 中 哪些 在 线 ， 这 
个 过 程 使 用 了 map0 函数 进行 过 滤 ， 若 在 client_address 列表 有 这 个 好 友 Id， 那 么 这 个 好 友 就 
是 在 线 的 。 

代码 第 @ 行 遍历 好 友 列 表 friends， 添 加 好 友 列 表 在 线 状 态 ，online 键 对 应 好 友 在 线 状态 ， 
好 友 列 表 friends 在 数据 库 查询 返回 时 没有 online 键 。 

代码 第 @ 行 将 好 友 列 表 添 加 到 JSON 对 象 json_obj 中 ，json_obj 对 象 中 还 保存 了 用 户 信 息 
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和 返回 结果 ，json_obj['result'] = '0' 表示 返回 结果 是 登录 成 功 。 代 码 第 @ 行 是 给 客户 端 发 送 
数据 。 

如 果 登 录 失 败 ， 设 置 json_obj[result] = '-1' 表示 返回 结果 是 登录 失败 ， 然 后 通过 代码 
第 ! 行 给 客户 端 发 送 数据 。 


24.7 任务 6: 刷新 好 友 列 表 


用 户 好 友 列表 状态 是 不 断 变化 的 ， 服 务 器 端 会 定期 发 送 在 线 的 用 户 列表 ， 以 便于 客户 端 刷 
新 自己 的 好 友 列 表 。 这 个 过 程 如 图 24-17 所 示 ， 操 作 步 骤 如 下 。 

第 @@ 步 : 服务 器 端 定期 发 送 在 线 用 户 列表 给 所 有 在 线 的 客户 端 。 

第 @ 步 : 客户 端 刷新 好 友 列 表 。 


客户 端 客户 映 
8 <> 加 完 划 发 送 @ 
Ri 在 线 用 户 列表 2 
a 2 
@ 客户 并 Sh 
出 新 好 友 列表 


@ 客户 端 
刷新 好 友 列 表 


用 PA 
用 户 3 
@® 客户 
和 刷新 好 友 列表 


图 24-17 刷新 好 友 列表 过 程 


24.7.1 迷人 代 6.1: 刷新 好 友 列 表 服务 器 端 编程 
服务 器 端 定期 发 送 在 线 用 户 列表 给 所 有 在 线 的 客户 端 ，qq_serverpy 代码 如 下 : 


# coding=utf-8 
# 代码 文件 ，chapter24/Q882006/qq_server.py 


# 主 循环 
while True: 
try: 
# 接收 数据 包 
data, client address = server socket.recvfrom(1024) 
json obj = json.loads (data.decode ()) 


logger .info(' 服务 器 端 接收 客户 端 ， 消 息 : {0}' .format (json_obj)) 


# 取出 客户 端 传递 过 来 的 操作 命令 


command = json obj['command'] 
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回 
扫 码 看 视频 


if command == COMMAND LOGIN: 寺 用 户 登录 过 程 
# 通过 用 户 Id 查询 用 户 信息 
# TODO 用 户 登录 过 程 


elif command == COMMAND SENDMSG: # 用 户 发 送 消 息 


# TODO 用 户 发 送 消息 


# 刷新 用 户 列表 
# 如 果 client1ist 中 没有 元 素 则 跳 到 下 次 循环 
if len(client1ist) == 

continue 


json obj = {} 

json_obj['command'] = COMMAND REFRESH 

usersid map = map(lambda it: it[0], clientlist) 
useridlist = list(usersid map) 

json obj['OnlineUserList'] = useridlist 


© @ eo 


for clientinfo in clientlist: 
_, address = clientinfo 
# JSON 编码 
json_str = json.dumps (json_obj) 
# 给 客户 端 发 送 数据 


server_socket.sendto(json str.encode(), address) 


except Exception: 
tb.print exc() 
logger.info('timed out') 


上 述 代码 第 @ 行 为 客户 端 设 置 了 操作 命令 COMMAND_REFRESH (刷新 好 友 列 表 ) 。 代 码 
第 @ 行 使 用 map() 函数 对 clientlist 进行 映射 ， 返 回 usersid_map 对 象 ， 它 是 一 种 map 类 型 ， 然 
后 再 通过 list(usersid_map) 返回 列表 ， 该 列表 是 在 线 用 户 Id 列表 。 代 码 第 @ 行 将 在 线 用 户 Id 
列表 保存 到 json_obj 对 象 中 。 

代码 第 @ 行 是 根据 在 线 用 户 列表 进行 遍历 ， 逐 一 给 每 个 用 户 发 送 消息 ， 客 户 端 会 收 到 如 下 
JSON 消息 。 

{ 


"command": 4, 

"OnlineUserList": [ # 当前 用 户 Id 列表 
J 
ey 


"333" 


} 


24.7.2 ”迭代 6.2: 刷新 好 友 列 表 客 户 端 编程 
客户 端 在 好 友 列 表 窗 口 和 聊天 窗口 时 都 可 以 刷新 好 友 列 表 ， 那 么 需要 在 FriendsFrame 和 
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ChatFrame 中 添加 接收 服务 器 端 信息 功能 ， 并 刷新 好 友 列 表 的 代码 。 为 了 不 阻塞 主线 程 (UI 线 
程 )， 这 些 处 理应 该 放 到 子 线程 中 。 
friends_frame.py 相关 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/Q82006/com/zhijieketang/qq/client/friends_frame.py 


class FriendsFrame (MyFrame): 
def _init (self, user): 
super()._init (title=' 我 的 好 友 '，size=(260，600)) 


self.chatFrame = None 


# 用 户 信息 

self.user = user 

# 好 友 列 表 

self.friends = user['friends'] 
# 保存 好 友 控 件 的 列表 


self.friendctrols = [] 


# 初始 化 线程 

# 子 线程 运行 状态 

self.isrunning = True (0) 
# 创建 一 个 子 线程 

self.tl = threading.Thread (target=self.thread body) [2) 
# 启动 线程 上 1 

self.tl.start () [ey 


# 刷新 好 友 列 表 


def refreshfriendlist (self, onlineuserlist): 


for index, friend in enumerate(self.friends): 
frienduserid = friend['user id'] 


fdname st, fdqq st, fdicon sb, fdicon = self.friendctrols[index] 


if frienduserid in onlineuserlist: 
fdname_st.Enable (True) 
fdqq_st.Enable (True) 
fdicon_sb.Enable (True) 
fdicon sb.SetBitmap (fdicon) 

else: 
fdname st.Enable (False) 
fdqq_st.Enable (False) 
fdicon sb.Enable (False) 
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fdicon sb.SetBitmap (fdicon.ConvertToDisabled()) 


# 重 绘 窗口 ， 显 示 更 换 之 后 的 图 片 
self.contentpanel .Layout () 


# 线程 体 函 数 
def thread body (self): 图 
# 当前 线程 对 象 
while self.isrunning: © 
try: 
# 从 服务 器 端 接收 数据 
json data, _ = client socket.recvfrom(1024) 
# JSON 解码 


json obj = json.loads (json_data.decode ()) 
logger.info(' 从 服务 器 端 接收 数据 : {0}' . format (json_obj) ) 


cmd = json_ obj['command'] 


if cmd is not None and cmd == COMMAND REFRESH: @ 
useridlist = json obj['OnlineUserList'] 
if useridlist is not None and len(useridlist) > 0: 
# 刷新 好 友 列 表 


self.refreshfriendlist (useridlist) 


except Exception: 


continue 


# 重启 子 线程 
def resettread(self) : 
# 子 线程 运行 状态 
self.isrunning = True 
# 创建 一 个 子 线程 
self.tl = threading.Thread (target=self.thread body) 
# 启动 线程 t1 
self.tl1.start() 


上 述 代码 第 @ 行 定义 了 成 员 变量 isrunning， 该 变量 用 来 设置 子 线程 停止 还 是 继续 。 代 码 第 
@ 行 创建 了 子 线程 。 代 码 第 @ 行 启动 了 子 线程 。 代 码 第 @ 行 是 线程 体 函 数 ， 要 来 执行 子 线程 操 
作 。 代 码 第 @@ 行 根据 成 员 变量 isrunning 判断 是 否 继续 执行 子 线程 。 代 码 第 @ 行 接收 从 服务 器 
端 返 回 的 数据 。 代 码 第 @ 行 判断 操作 命令 是 否 为 COMMAND_REFRESH (刷新 好 友 列 表 )， 如 
果 是 则 调用 refreshFriendList() 方法 刷新 好 友 列 表 。 

代码 第 @ 行 定义 了 重新 启动 接收 消息 子 线程 方法 resettread()， 该 方法 用 来 启动 一 个 接收 消 
息 子 线程 。 当 关闭 聊天 窗口 回 到 好 友 列 表 窗 口 时 调用 该 方法 。 

chat_frame.py 相关 代码 如 下 : 


class ChatFrame (MyFrame): 
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def _init (self, friendsframe, user, friend): 


super()._init (title='', size=(450, 400)) 


# 子 线 程 运行 状态 

self.isrunning = True 

# 创建 一 个 子 线程 

self.tl = threading.Thread(target=self.thread body) [0) 
# 启动 线程 t1 

self.tl.start () 


# 线程 体 函 数 
def thread body(self) : 
# 当前 线程 对 象 
while self.isrunning: 
try: 
# 从 服务 器 端 接收 数据 
json data, _ = client socket.recvfrom(1024) 
# JSON 解码 
json_obj = json.loads (json data.decode()) 
logger.info('CharFrame 从 服务 器 端 接收 数据 : {0}' .format (json_obj)) 
command = json obj['command'] 


# command 不 等 于 空 值 时 执行 

if command is not None and command 一 COMMAND REFRESH: # 刷新 好 友 列 表 四 
# 获得 好 友 列 表 
userids = json obj['OnlineUserList'] 
# 刷新 好 友 列 表 


self.friendsframe.refreshfriendlist (userids) 
else: # 接收 聊天 信息 
# TODO 接收 聊天 信息 @ 


except Exception: 


continue 


上 述 代 码 第 @ 行 是 创建 子 线程 ， 然 后 再 启动 子 线程 ， 线 程 启动 时 会 调用 线程 体 函 
数 thread_body(self)， 在 线程 体 函 数 中 代码 第 @@ 行 判断 是 否 刷 新 好 友 列 表 (COMMAND_ 
REFRESH)， 代 码 第 @ 行 是 接收 聊天 信息 。 


24.8 任务 7: 聊天 过 程 实现 


聊天 过 程 如 图 24-18 所 示 ， 客 户 端 用 户 1 向 用 户 3 发 送 消息 ， 这 个 过 程 实现 有 三 个 步 又。 
第 @ 步 : 客户 端 用 户 1 向 用 户 3 发 送 消息 。 

第 @ 步 : 服务 器 端 接收 用 户 1 消息 与 转发 给 用 户 3 消息 。 

第 @ 步 : 客户 端 用 户 3 接收 用 户 1 消息 。 
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@ 客户 端 用 户 1 向 服务 器 
发 送 消息 和 @ 
用 户 1 用 户 2 
@ 服务 器 接收 用 户 1 消息 
与 转发 给 用 户 3 消息 
湛 
国 客户 端 用 户 3 接收 
用 户 1 消息 
用 户 4 用 户 3 


图 24-18 ”聊天 过 程 


24.8.1 迭代 7.1: 客户 端 用 户 工 向 服务 器 发 送 消息 
客户 端 用 户 1 向 用 户 3 发 送 消息 是 在 聊天 窗口 chat_frame 模块 中 实现 的 。chat_frame.py 


# coding=utf-8 
# 代码 文件 ，chapter24/QQ2006/com/zhijieketang/qq/client/chat_frame.py 


class ChatFrame (MyFrame): 
def _init (self, friendsframe, user, friend): 
super()._init (title='', size=(450, 400)) 


def on click(self, event): 

# 发 送 消息 

if self.sendmsg tc.GetValue() != "'': 
now = datetime.datetime.today () 
strnow = now.strftime ('®%Y-%m-%d %H:%M:%S') 
# 在 消息 查看 框 中 显示 消息 
msg = '#{0}#\n 您 对 {1} 说 : {2}\n'.format (strnow, 

self.friend['user name'], self.sendmsg tc.GetValue()) 

self.msglog += msg 


self.seemsg_tc.SetValue (self.msglog) 加 
# 光标 显示 在 最 后 一 行 
self.seemsg tc.SetInsertionPointEnd() 四 


# 向 服务 器 端 发 送 消息 


json obj = {} [e) 
json obj['command'] = COMMAND SENDMSG 
json obj['user id'] = self.user['user id'] 


json obj['message'] = self.sendmsg tc.GetValue() 
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json obj['receive user id'] = self.friend['user id'] 


# JSON 编码 

json_str = json.dumps (json_obj) 

# 给 服务 器 端 发 送 数据 

client socket.sendto(json str.encode(), server address) ©® 
# 清空 发 送 消息 文本 框 


self.sendmsg tc.SsetValue('') 


上 述 代码 第 @ 行 是 当 用 户 单 击 发 送 按钮 时 调用 on_click(self event) 方法 。 代 码 第 @ 行 判断 
发 送 消息 文本 框 是 否 为 空 。 代 码 第 @ 行 将 日 志 信息 在 查看 框 中 显示 。 代 码 第 @ 行 是 将 光标 显示 
到 信息 查看 框 的 最 后 一 行 。 

代码 第 @ 行 和 第 @ 行 是 准备 向 服务 器 端 发 送 消息 。 代 码 第 @ 行 向 服务 器 端 发 送 数 据 ， 数 据 
格式 如 下 : 


{ 


"receive user id": "222", # 接收 消息 的 用 户 Ta 〈 即 用 户 3) 
"message": "你 好 吗 ? "， # 发 送 的 消息 

“iser id"s “LLL", # 发 送 消息 的 用 户 Id( 即 用 户 1) 
"command": 3 # 命令 3 是 发 送 聊天 消息 


} 


24.8.2 ”迭代 7.2: 服务 器 端 接 收 用 户 1 消息 与 转发 给 用 户 3 消息 
服务 器 端 接收 用 户 1 消息 与 转发 给 用 户 3 消息 是 在 qq_server 模块 中 完成 的 ， 相 关 代 码 如 下 ， 国 


# coding=utf-8 
# 代码 文件 : chapter24/Q882006/qq_server.py 扫 码 看 视频 


# 主 循环 
while True : 
try: 
# 接收 数据 包 
data, client address = server socket.recvfrom(1024) 
json_obj = json.loads (data.decode ()) 


logger.info(' 服务 器 端 接收 客户 端 消 息 ，{0}' .format (json_obj)) 


# 取出 客户 端 传递 过 来 的 操作 命令 


command = json_obj['command'] 
if command == COMMAND LOGIN: # 用 户 登录 过 程 

# 通过 用 户 Id 查询 用 户 信息 
elif command == COMMAND SENDMSG: # 用 户 发 送 消息 (Oy 


# 获得 好 友 Id 
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fduserid = json obj['receive user id'] ©® 
# 向 客户 端 发 送 数据 
# 在 clientlist 中 查找 好 友 Id 


filter_clientinfo = filter(lambda it: it[0] == fduserid, clientlist) @ 

clientinfo = list(filter clientinfo) 

if len(clientinfo) == 1: @ 
_, client address = clientinfo[0] © 


# 服务 器 端 转发 消息 给 客户 端 
# JSON 编码 
json_str = json.dumps (json obj) 


server_ socket.sendto(json str.encode(), client address) 
elif command == COMMAND LOGOUT: # 用 户 发 送 下 线 命令 


# 获得 用 户 Id 


except Exception: 
tb.print exc() 
logger.info('timed out') 


上 述 代 码 第 @ 行 是 判断 客户 端 命 名 是 否 为 “用 户 发 送 消 息 ”。 代 码 第 @ 行 获得 接收 消息 的 
用 户 好 友 Id。 要 想 给 用 户 3 发 消息 ， 需 要 在 clientlist 登录 用 户 列表 中 查找 该 用 户 。 代 码 第 @ 
行 通过 filter( 函数 过 滤 找 到 该 用 户 。 代 码 第 @ 行 len(clientinfo) == 1 判断 是 否 找到 该 用 户 ， 如 
果 找 到 则 代码 第 @ 行 取出 该 用 户 的 主机 地 址 和 端口 。 代 码 第 @ 行 是 发 送 消息 给 客户 端 ， 消 息 示 
例如 下 : 

| "receive user id": "111", # 发 送 消 息 的 用 户 Id( 即 用 户 1) 


# 接收 消息 的 用 户 Id〈 即 用 户 3) 
# 发 送 的 消息 


} 


24.8.3 迭代 7.3: 客户 端 用 户 3 接收 用 户 1 消息 


客户 端 用 户 3 接收 用 户 1 消息 是 在 聊天 窗口 类 ChatFrame 中 的 接收 消息 子 线程 中 实现 的 ， 
这 个 接收 消息 代码 与 ChatFrame 中 刷新 好 友 列 表 代 码 共用 一 个 线程 。 
3 ChatFrame 中 相关 代码 如 下 : 


# coding=utf-8 


# 代码 文件 : chapter24/QQ2006/com/zhijieketang/qq/client/chat_frame.py 
""" 好 友 聊天 窗口 """ 


class ChatFrame (MyFrame): 


def _init (self, friendsframe, user, friend): 
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super()._ init (title='', size=(450, 400)) 


# 线程 体 函数 
def thread body (self): 
# 当前 线程 对 象 
while self.isrunning: 
try: 
# 从 服务 器 端 接收 数据 
json data, _ = client socket.recvfrom(1024) 
# JSON 解码 
json obj = json.loads (json_data.decode () ) 
logger.info('CharFrame 从 服务 器 端 接收 数据 : {0}' . format (json_obj) ) 
command = json obj['command'] 
# command 不 等 于 空 值 时 执行 刷新 好 友 列 表 
if command is not None and command == COMMAND REFRESH: 
# 获得 好 友 列表 


else: 

# 获得 当前 时 间 ， 并 格式 化 

now = datetime.datetime.today() 

strnow = now.strftime ('%Y-%m-%d %H:%M:%S') 

# 在 消息 查看 框 中 显示 消息 

message = json obj['message'] oa 

1og = "#{0}#\n{1} 对 您 说 : {2}\n".format (strnow, self.friend 
['user name'], message) 

self.msglog += log 

self.seemsg tc.SetValue (self.msglog) 回 

# 光标 显示 在 最 后 一 行 


self.seemsg_tc.SetInsertionPointEnd () 


except Exception: 


# 出 现 异 常 ， 休 了 眠 2 秒 ， 再 接收 数据 
# time.sleep (2) 


continue 


上 述 代 码 第 包 行 是 取出 接收 的 消息 ， 代 码 第 @ 行 是 将 接收 的 消息 显示 在 消息 查看 框 中 。 


24.9 任务 8: 用户 下 线 


用 户 单 击 关 闭 好 友 列 表 窗 口 就 会 下 线 ， 在 服务 器 端 会 即时 下 线 用 户 登 录 信息 ， 但 不 会 马上 
通知 其 他 客户 端 ， 而 是 等 到 下 一 次 刷新 好 友 列 表 时 ， 好 友 才 能 看 到 该 用 户 已 经 下 线 的 消息 。 这 
个 过 程 如 图 24-19 所 示 。 

第 @ 步 : 用 户 1 下 线 。 

第 @ 步 : 服务 器 端 下 线 用 户 。 
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服务 器 
@ 服务 器 端 下 线 用 户 


图 24-19 用 户 下 线 刷 新 好 友 列表 


24.9.1 返 代 8.1: 客户 端 编程 
用 户 关 闭 好 友 列表 窗口 会 触发 用 户 下 线 处 理 ，FriendsFrame 相关 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/Q8Q2006/com/zhijieketang/qq/client/friends_frame.py 


class FriendsFrame (MyFrame): 
def _init (self, user): 
super () ._init (title=' 我 的 好 友 '，size=(260，600)) 


def OnClose (self, event): O 


if self.chatFrame is not None and self.chatFrame.IsShown() : 
dlg = wx.MessageDialog(self， ' 请 先 关 闭 聊 天 窗口 ， 再 关闭 好 友 列 表 窗 口 。'， 
" 操作 失败 '， 
WX.OK | wx.ICON ERROR) 
dlg.ShowModal () 
dlg.Destroy() 


return 


# 当前 用 户 下 线 ， 给 服务 器 端 发 送 下 线 消息 


json obj = {} @ 
json_obj['command'] = COMMAND LOGOUT 

json obj['user id'] = self.user['user id'] @ 
# JSON 编码 

json_str = json.dumps (json_obj) 


# 给 服务 器 端 发 送 数据 
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client socket.sendto(json str.encode(), server address) @ 
# 停止 当前 子 线程 

self.isrunning = False 回 
self.tl.join() 


self.tl = None 


# 关闭 窗口 ， 并 退出 系统 


super () .OnClose (event) 
上 述 代 码 第 Q@@ 行 OnClose(self event) 方法 在 用 户 关闭 窗口 时 候 调用 。 代 码 第 @ 行 和 第 @ 行 
用 来 准备 给 服务 器 端 发 送 数 据 。 代 码 第 @ 行 发 送 下 线 消息 。 发 送 的 JSON 消息 格式 如 下 : 
{ 
“alk ds “Le, ## 发 送 消息 的 用 户 Id〈 即 用 户 1) 


"command": 2 # 命 令 2 是 用 户 下 线 
} 


代码 第 @ 行 是 设置 isrunning 变量 为 False 停止 子 线程 。 代 码 第 @ 行 是 挂 起 主线 程 ， 等 待 t 
子 线程 介绍 。 
24.9.2” 壕 代 8.2: 服务 器 端 编程 


服务 器 端 接收 用 户 下 线 消息 将 该 用 户 下 线 ， 就 是 将 用 户 从 clientlist 列表 中 删除 。qq_server 
模块 相关 代码 如 下 : 


# coding=utf-8 
# 代码 文件 : chapter24/Q82006/qq_server.py 


# 主 循环 
while True: 
try: 
# 接收 数据 包 
data, client address = server socket.recvfrom(1024) 
json_obj = json.loads (data.decode ()) 


logger.info(' 服务 器 端 接收 客户 端 消 息 : {0}' .format (json_obj) ) 


# 取出 客户 端 传递 过 来 的 操作 命令 


command = json_obj['command'] 


if command == COMMAND LOGIN: # 用 户 登录 过 程 

elif command == COMMAND SENDMSG: # 用 户 发 送 消息 
# 获得 好 友 Id 

elif command == COMMAND LOGOUT: # 用 户 发 送 下 线 命令 (0 
# 获得 用 户 Id 


userid = json obj['user id'] 


@e 


for clientinfo in clientlist: 
cuserid, _ = clientinfo 


if cuserid == userid: 
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## 从 clientlist 列表 中 删除 用 户 
clientlist.remove (clientinfo) @ 
break 


logger.info (clientlist) 
# 刷新 用 户 列表 


except Exception: 
tb.print exc() 
logger.info('timed out') 


上 述 代码 第 @ 行 判断 命令 是 用 户 下 线 命令 。 代 码 第 @ 行 是 获得 当前 用 户 4。 代码 第 @ 行 遍 
历 clientlist 列表 ， 当 找到 要 下 线 的 用 户 Id 时 ， 则 从 clientlist 列表 中 删除 用 户 ， 见 代码 第 @ 行 。 

用 户 下 线 后 ， 服 务 器 端 clientlist 列表 中 该 用 户 信息 会 被 删除 ， 当 服务 器 端 再 次 发 送 刷新 好 
友 列 表 消 息 时 ， 其 他 用 户 会 收 到 该 用 户 已 经 下 线 消 息 ， 于 是 刷新 自己 的 好 友 列表 。 


